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@ SEQUENCE NUCLEOTIDIQUE CODANT POUR UNE FLAVINE IWONOnYvrFMAQP DDnxciMir 
^ CORRESPONDANTE ET COMPOSITION DESTINEE AU DiIgNOsS^ A ^ THeS'^SO GLAU^COmI!''^ 

^7) La presents invention conceme notamment une se- 
quence nucleotidique isolee, caracterisee en ce qu'elle est 
choisie parnii: 

(a) les sequences codant pour la proteine FM02 ou 
FMOx humaine et leurs variants proteiques, 

(b) les sequences codant pour un fragment de I'une de 
ces proteines ayant au moins 1 0 bases, 

(c) les sequences genomiques FM02 ou FMOx humat- 
nes et leurs alleles, 

(d) les sequences presentant au moins 90% d'homoloqie 
avec les sequences (a) et (c); 

(e) les fragments des sequences (c) ou (d) avant au 
moins 1 0 bases 

(f) les sequences qui s'hybrident avec une sequence de 
(a) a (e). 

Ces sequences peuvent etre notamment utilis^es pour le 
diagnostic et la therapie du glaucome. 
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Sequence nucleoiidique codant pour une flavine monooxygenase, proteine correspondante 
et composition destinee au diagnostic et a la therapie du glaucome 

La presente invention conceme notammenl la flavine monooxygenase 2 
5 humaine (hFM02), ainsi que les sequences nucleotidiques et peptidiques de cette nouvelle 

enzyme. La presente invention concerne egalement une autre enzyme humaine de la famille 
FMO, hFMOx, ainsi que le diagnostic et la therapie du glaucome juvenile, et plus 
generalement du glaucome primaire a angle ouvert, rendus possibles grace a la 
cormaissance de ces enzymes. 

10 Le glaucome primaire a angle ouvert (GPAO) est Tune des toutes premieres 

causes de cecite irreversible dans les pays developpes. La maladie se msmifeste par une 
incurvation caracteristique du disque optique, et une alteration du champ visuel, 
typiquement associees a un facteur de risque majeur: une hyp>ertension oculaire. Les 
premiers symptomcs, qui sc manifestent generalement apres quarante ans, sont indolores; le 

IS GPAO progresse de fa9on silencieuse et lente, si bien qu'il est generalement diagnostique 

tardivement, a un stade irreversible ou il evcluera vers la cecite. 

La physiopathologie du GPAO est meconnue et probablement complexe. Le 
glaucome juvenile (GPAO- J), qui se manifeste generalement avant Tage de vingt ans, est 
une pathologic moins repandue, qui affecte neanmoins plus de 100.000 persoimes en 

20 France. Les seuls traitements pratiques aujourd'hui, notamment medicaux et chinirgicaux, 

s'adressent a Thypertension oculaire et aux lesions du nerf optique. lis ne sont efficaces 
qu'en cas de depistage precoce de la maladie; un depistage tardif conduit a une chirurgie 
lourde qui peut laisser des handicaps. II est done necessaire de developper des moyens de 
depistage precoce et de diagnostic du glaucome, ainsi que des traitements non chirurgicaux 

25 adaptes aux patients identifies grace a ces nouveaux moyens. 

La frequence elevee de cas de GPAO parmi les parents de patients atteints de 
GPAO indique que la susceptibilite au GPAO a des bases genetiques, probablement 
complexes. On a pu recemment confirmer que le gene responsable de la survenue du 
glaucome juvenile est localise au sein du locus genetique GLCIA, entre les marqueurs 

30 microsatellites D1S3665 et D1S3664 (environ 3cMX selon Sunden el al. 1996, et entre les 

marqueurs NGA1/DIS210 et NGA5 (environ 3cM), selon les inventeurs (Belmouden et al. 
1996). Plusieurs genes candidats presents dans la region Iq21-q31 initialement identifiee 
(brevet FR 2 733 251 ; Meyer et al. 1996), ont ete examines par Sunden et al. 1996, et par 
les inventeurs (Belmouden et al. 1996). Leur r61e dans la survenue du glaucome a ete exclu. 

35 
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II « est done, ndcessaix&v. d'identifier Acs., sequences.. nucl^QUdiq^ues« . - 
responsables de la survenue du giaucome juvenile et incluses dans la region dStermin^ 
comme indiqu^ pr^c^demment, et dont la caracterisation a 6t6 compldt^e par les 
inventeurs, d'une carte physique et d'un contig de YACs associds (Belmouden et al. 
5 1996). L*identifi cation de ces s^uences pourra foumir une explication biochimique 
des causes du GPAO-J et permettra en outre d'identifier certains des m^canismes k 
I'origine du GPAO. Elle rendra done possible le d^pistage pr^coce. le diagnostic et la 
th^rapie du GPAO, notammeni de sa forme juvenile. 

L'identification du gfene associd k la survenue du GPAO-J, k partir de la 
10 localisation sur le locus GCLl A, peut fitre mende en utilisant les donnfes de la carte 
int^gree CEPH/Gdndthon du gdnome humain, corroborfes par les donndes de la carte 
de la region dtablie par Belmouden et al. 1996. 

Dhs lors qu'une region candidate a 6t€ d^finie, il est ndcessaire d'avoir 
acc&s au fragment du g6nome couvrant Tintervalle oh se situe le gene recherche. Cette 
15 etape passe par I'^tablissement d'une carte physique, k savoir le recouvrement de la 
region par un ensemble de fragments clones et ordonn^s. Aujourd'hui, grace aux 
donn^es de la carte integree CEPH/Genethon du genome humain, environ 80% du 
genome est recouvert par des clones de YACs, sous clonds en BACs dont la 
localisation sur les chromosomes se fait par rinterm^diaire de marqueurs polymorphes 
20 et g^ndtiquement ordonn^s (Chumakov et al. 1995). Cette carte physico-gdn^tique 
permet de gagner un temps considerable, notamment par Tutilisation du s^quen9age 
exhaustif des regions d'int^ret. 

Aprfes analyse des sequences de ces rdgions, comme le GPAO-J est unc 
maladie autosomale dominante, on recherche les sites d'h^t^rozygotie chez les patients 
25 atteints de glaucome juv6nile et on etudie leur absence ou presence chez des sujets 
contrdles. On determine ainsi les g&nes associ^s k la maladie, et les mutations dans ces 
gfenes associ^es au ph^notype malade. 

En outre, gr&ce k Tutilisation de banques d*dtiquettes 5', on peut verifier 
Texpression des g6nes candidats identifies comme precedemment : Tidentifi cation 
30 d'une etiquette hybridant k Tune des sequences candidates indique, puisque celle-ci est 
issue d'une banque d*ADNc, la presence d*ARNm et done d'une expression des 
sequences en question dans les tissus consideres, 

C'est pourquoi la presente invention concerne notamment un 
polynucleotide isoie, dont la sequence est representee Figure 2. et qui code pour la 
35 protdne ayant la sequence identifiee selon la Figure 1. 

La presente invention concerne egalement un polynucleotide isoie. dont 
la sequence est representee Figure 10. 
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Ces deux s^uences nucldotidiques sont celLea,de,.deux^ne& codant 
pour de nouvelles enzymes de la famille des mono-oxyg6nases k flavine (FMO) 
humaines. respectivement hFM02 et hFMOx, Ceci a 6i6 dtabli par comparison des 
sequences identifides aux sequences d6jk connues de FMO: des homologies 
5 structurales trfes fortes entre les deux sequences dtudides et celles des FMO. des 
homologies trfes fortes entre la premiere sequence et les FM02, notamment de 
macaque (FM02 de macaque: sequence GeneBank U59453), ainsi qu'une homologie 
non suffisante de la seconde sequence avec aucune des FMO d6jk r^pertorides chez 
I'homme ont permis de conclure. 
10 PMO (flavin-containing monooxygenases) mammifdrcs (Lawton et 

al. 1994) forment une famille d'enzymes catalysant !' oxydation NADPH-ddpendante 
de nombreux composes organiques exog^nes, amines, sulfur€s ou phosphords, qu'il 
s*agisse de mddicamenls, de pesticides ou autres substances toxiques. La cysidamine 
est le seul substrat endogfene actuellemenl connu. A ce jour, cinq isoformes des FMO 
15 ont ete caracterisdes dans Pespece de rdfdrence, le lapin. Leur homologie est de 50- 
60%. Quatre de ces isoformes. FMOl. FM03, FM04 et FM05 ont 6\6 identifies chez 
Thomme (sequences GeneBank M64082, M83772, Z11737 et L37080 
respectivement) . Parmi les espfeces mammifferes, Thomologie entre FMO orthologues 
est supdrieure k 80%. L*existence d'une FM02. voire d'autres isoformes, chez 
20 1 'homme, peut etre raisonnablement postulfe. 

Selon la pr&ente invention, il a 6i6 dtabli, aprts localisation du BAG 
123H04M sur le locus gdndtique GLCIA, que Pinsertion qu'il porte contient les 
parties 3' de hFM03, 5* de hFMOl, ainsi que la sequence complete de hf=M02, et 
celle d*un autre nouveau gene membre de le famille FMO. le hFMOx. 
25 La structure exonique des gfenes de la famille FMO d6}k connus, est 

entiferement conservde dans la sequence nucldotidique hFM02 selon Tinvention. Les 
sequences de chacun des 9 cxons du polynucleotide selon Tinvention (Figure 3) 
presenteni des degres d'homologie variant de 95% k 98% en ADN avec la sequence 
correspondante de TARN messager de la FM02 de macaque (Figure 4). Les 
30 divergences entre les deux sequences nucldotidiques, ainsi que leur signification 
envers la sequence peptidique, sont presentees sur la Figure 5. La sequence 
polynucleotidique selon Tinvention code pour une protdine de 535 acides 
amines (Figure 1); la sequence de TARN messager prddite. ainsi que la sequence 
polypeptidique de la prot^ine humaine sont homologues k 97% avec celles de la FM02 
35 de macaque (Figures 6 et 7), ce qui a permis I'identification du polypeptide selon 
Tinvention comme dtant la FM02 humaine. Le polypeptide selon la Figure 1 pr&ente 
^galement un haut degrd d'homologie avec d'autres flavine-monooxygdnases 2 de 
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mammiC^res; ses.degi:^ d*homoiogie.ave^ d'autres prot^ines de la,f[ainiUe.4es,llayine- 
monooxyg^nases sonl moins forts. 

La prdsente invention conceme done les sequences d'ADN ou d*ARN, 
I'ADN pouvant etre gdnomique, ADN compldmentaire ou synthdtique, des FMO. 
5 notamment de hFM02 et hFMOx, ainsi que les protdines correspondantes. 

La presence invention conceme en outre le diagnostic el la thdrapie du 

glaucome. 

En effet, un site d'Wt^rozygotie present dans Texon 8 du polypeptide 

selon rinvention sdgr^ge, dans Tune des families dtudides, avec le ph^notype GPAO-J 
10 (Figure 8). En poursuivant la recherche des polymorphismes sdgrdgeant avec le 

ph^notype malade dans les families dtudides, et situ^s dans des sequences 

correspondant k celles portees par ['insertion du BAG 123H04M. ou plus 

gdndralement par les sequences FMO, on pourra identifier notamment les mutations 

associ^es k la survenue du GPAO-J. 
15 Les diff^rentes isofcnmes des FMO ne semblent pas se distinguer par la 

specificity tissulaire de leur expression, mais plutot par les substrats dont elles 

catalysent la transformation. L'expression des FMO n*a pas ^t^ itudide dans Toeil. 

Elle a toutefois 6i€ mise en Evidence dans le cerveau, dont Torigine embryologique est 

identique h celle de rceil. 
20 L*effet pathogene d'un deficit fonctionnel d*une FMO pourrait r^sulter 

d*une capacite diminufe des tissus ou elle s'exprime a r&ister au stress oxydatif. 

Dans le glaucome, une alteration des FMO rdduirait la capacity des 

cellules trabeculaires et/ou r^tiniennes k resister au stress oxydatif. II en rdsulterait une 

diminution de la resorption de Thumeur aqueuse, dont d6couIerait Thypertonie oculairc 
25 qui accompagne le glaucome, et une ddgendrescence des Tibres nerveuses optiques k 

Porigine de Talt^ration du champ visuel. 

Plus gen^ralement, par leur role dans le mdtabolisme oxydatif et leur 

fonction de detoxification, les FMO pourraient etre impliqu^es dans toute pathologie 

degenerative ou toxique, demontree ou k prouver, notamment celles on une mort 
30 cellulaire programmee peut etre mise en evidence, et les maladies degeneratives du 

systfeme nerveux central. 

De fa^on generale, le glaucome ou plus specifiquement le glaucome 

juvenile, ainsi que les autres pathologies liees au fonctionnement des FMO. sont 

rassembies sous le nom de "troubles lies k FMO". 
35 Par "FMO", on entendra designer Tune quclconque des FMO humaines 

connues, FMOl, FM03, FM04 et FM05, ou nouvellement ddcrites dans la presente 

demande de brevet, k savoir FM02 ou FMOx. 
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Certaines de ces. pathologies pourront avoir une origine. nuilttg^iqjier 
mais pour toutes. les modificaUons d'une ou plusieure FMO contribuent h la survenue 
de la pathologie ou h son agravation. 
Les sequences nucldotidiques 
5 La pr^sente invention concerne, tout d'abord, une sequence 

nuciaotidique Isolde, caractdrisde en ce qu'elle est choisie parmi : 

(a) les sequences codant pour les protdines FM02 ou FMOx humaines et leure 
variants protdiques, 

(b) les sequences codant pour un fragment de ces protdines et ayant au moins 10 
10 bases, 

(c) les sequences gdnomiques FM02 ou FMOx humaines et leurs alleles. 

(d) les sequences pr&entant au moins 80%, et de prdKrence au moins 90%, 
d'homologie avec les sequences (a) et (c); 

(e) les fragments des sequences (c) ou (d) ayant au moins 10 bases. 
15 (0 les sequences qui s'hybrident avec une sequence de (a) Ji(e). 

II doit Stre compris que la pr^ente invention ne concerne pas les 
sequences nucldotidiques gdnomiques dans leur environnement chromosomique 
naturel, c'est-A-dire k V6tzt naturel. il s'agit de sequences qui ont €t6 isoldes. c'est-i- 
dire qu'elles ont 6t6 prdlevdes directement ou indirectement. par exemple par copie 
(ADNc), leur environnement ayant 6l6 au moins partiellement modifid. 

Ainsi, il peut s'agir aussi bien d'ADNc que d'ADN g^nomique 
partiellement modifid ou portd par des sequences au moins partiellement diffdrentcs des 
s^uences les portant naturellemenL 

Ces sequences pourront egalement Stre qualifiees de "non naturelles". 
Par "sequence nuddique", on entend un fragment d'ADN et/ou d'ARN 
naturel isol6, ou de synthase, ddsignant un enchaTnement precis de nucleotides, 
modifies ou non, permettant de ddfinir un fragment, un segment ou une region d'un 
acide nucleique. 

Par "alleles", on entend designer les sequences muides naturelles 
correspondant k des polymorphismes pouvant exister chez I 'Stre humain et, 
notamment, ceux qui peuvent conduire au ddveloppement de la pathologie OPAOJ. 

Par "variant protdique". on entend designer 1 'ensemble des protdines 
mutdes pouvant exister chez I'etre humain. qui correspondent notamment k des 
troncatures, substitutions, ddldtions et/ou additions de rdsidus d'amino-acides. ainsi 
que les variants artificicls qui seront n^nmoins Egalement appelds "variants 
prot^iques". Dans le cas present, les variants sont li6s en partie k la survenue du 
GPAO-J. 
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Selon rinvention,,les.Craginenis 4e sequences . nucldiques geuveat. 
notammeni ccxier pour des domaincs de la proidine ou bien etre utilises comme sonde 
ou comme amorce dans des procdd^s de detection ou d 'identification ou 
d 'amplification. Ces fragments prdsentent une taille minimale de 10 bases et on 
5 prdf^rera des fragments de 20 bases, et de prdf^rence 30 bases. 

Selon rinvention, Thomologie est uniquement de type statistique, elle 
signifie que les sequences prdsentent au minimum 80%, et prdfdrentiellemenl 90%. de 
nucleotides en commun. 

Pour ce qui conceme les sequences (0. les conditions d'hybridaiion 
10 doivent j>ermettre, selon Tinvention, d'assurer au moins 95% d'homologie. 

Plus particulidrement, la pr^sente invention concerne une sequence 
nucltotidique choisie parmi : 

(a) les sequences codant pour un polypeptide comprenanl les amino-acides selon 
la sequence de la figure 1, 
15 (b) les sequences nucMiques correspondant k la figure 2 ou & la figure 10 ou 
codant pour le polypeptide conrespondant, 

(c) un fragment d'une sequence selon (a) ou (b) comportant au moins 10 bases, et 

(d) une sequence qui comporte par rapport aux sequences (a), (b) ou (c) au moins 
une mutation ponctuelle, 

20 (e) une sequence compiementaire des sequences (a), (b) (c) ou (d). 

Les figures 1 et 2 repr^sentent les sequences de FM02 telles qu'elles 
ont €l€ sdquenc^es sur un genome d'individu sain pour le GPAO, notamment pour Ic 
GPAO-J. 

La suaicture du gfene de hFM02 est identifife dans la figure 3. 
25 La sequence FMOx est identifiee sur la figure 10. 

Pour ce qui conceme les remarques particuliferes sur (a), (b), (c), (d) et 

(e) , les remarques prdc^dentes s'appliquent. 

L' invention conceme ^galement des fragments de ces sequences, en 
particulier des sequences codant pour des polypeptides ayani garde tout ou partie de 
30 Tactivite de la protdine FMO. 

Certaines de ces sequences peuvent etre identifiees en se reportant 
notammeni i la figure 3 qui schematise 1 'organisation de hFM02, 

Ces sequences partielles peuvent etre utilisees pour de nombreuses 
applications, comme cela sera decrit ci-aprfes, notamment pour effectuer des 
35 constructions proteiques de type FMO ou de types differents, mais egalement pour 
realiser par exemple des proteines FMO-like. 



BNSDOCID: <FR___2756845A1_L> 




2756845 



7 



Si les sequences d&rites sont, en g^ndr^l, les. s^ueiice& ncwFmales, , 
rinvention conceme dgalement les sequences mutdes dans la mesure oh elles 
comportent au moins une mutation ponctuelle et de pr^f6rence au plus 10% dc 
mutation. 

De prdf^rence, la prdsente invention concerne des sequences 
nucl^otidiques mut€es dans lesquelles les mutations ponctuelles sent non muettes, 
c'est-i-dire qu 'elles conduisent k une modification de Tamino-acide cod6 par rapport k 
la sequence normale. De fafon encore pref^rde, ces mutations portent sur des amino- 
acides qui structurent les prot^ines FMO ou les fragments correspondants de celles-ci, 
notamment dans les regions corrcspondant aux sites catalytiques, aux sites rdgulateurs 
ou aux sites de fixation des cofacteurs; les mutations peuvent ^galement porter sur les 
sequences impliqufes dans ie transport et Tadressage; elles peuvent aussi en particulier 
supprimer les cysteines ou. au contraire, en faire apparajtre, mais dgalement changer le 
caractSre de la protfiine. soit sur Ic plan de la charge, soit sur le plan de 
I'hydrophobicitd. 

La pr^sente invention concerne dgalement les mutations pouvant 
iniervenir dans les sequences promotrices et/ou rdgulatrices des gfenes FMO humains, 
lesquelles peuvent avoir des effets sur rexpression de la prot^ine. notamment sur son 
laux d 'expression. 

De fa^on gdn^rale, la presente invention s'int^resse aussi bien aux 
protdines FMO normales qu'aux proleines FMO mut^es. ainsi qu'i leurs fragments et 
aux sequences d'ADN et d'ARN correspondantes. 

Parmi les fragments nucl^otidiques pouvant etre intdressants. 
notamment pour le diagnostic, il faut citer dgalement les sequences gdnomiques 
introniques du gfene FMO. par exemple les sequences jonctions entre les introns et les 
exons. 

La presente invention concerne Tensemble des amorces qui peuvent etre 
ddduites des sequences nucl^otidiques pr&6dentes et qui peuvent permettre de les 
metire en evidence en utilisant une mdthode d •amplification telle que la m6thode PGR. 

La presente invention conceme 6galement les sequences nucl^otidiques 
qui peuvent comporter des nucleotides non naturels. notamment des nucldoiides 
soufrds par exemple ou de structure a ou B. 

Enfin, la prdsente invention conceme, bien entendu, aussi bien les 
sequences ADN qu'ARN ainsi que les sequences qui s'hybrident avec elles, de mtme 
que les ADN douUe brin correspondants. 
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Parmi les fragments d'acides nucldiques int^ressaajLs,: il.raut.cLter en 
particulier les oligonucleotides anti-sens, c'est-i-dire dont la structure assure, par 
hybridation avec la sequence cible, une inhibition de Texpression du produit 
correspondant. II faut dgalement citer les oligonucleotides sens qui, par interaction 
5 avec des prot^ines impliqudes dans la rdgulation de l*expression du produit 
correspondant, induiront soit une inhibition, soit une activation de cette expression. 

Comme cela sera ddcrit ci-aprfes, pour certaines applications, il peut etre 
ndcessaire de prdvoir des constructions mixtes, prot6ine/ADN/compos6 chimique, 
notamment Tutilisation d'agents intercalants par exemple, il doit etre compris que de 
10 tels composes sont couverts par Ic brevet comme comportant une sequence selon 
rinvention. 

Les protdines et polypeptides 

La prdsente invention conceme dgalement les protdines, polypeptides 
ou peptides correspondant aux sequences mentionndes pr&edemmcnt, sous forme non 
15 naturelle, c'est-^-dire qu'elles ne sont pas prises dans leur environnement naturel mais 
qu*elles ont pu etre obtenues par purification k partir de sources naturelles ou bien 
obtenues par recombinaison g6netique, comme cela sera decrit ci-apr6s. 

LMnvention conceme dgalement les memes polypeptides ou protdines 
obtenus par synthase chimique et pouvant comporter des amino-acides non-naturels. 
20 La prdsente invention conceme les protdines recombinantes ainsi 

obtenues aussi bien sous forme glycosylde que non glycosylde et pouvant presenter ou 
non la structure tertiaire naturelle. 
Les vecteurs et les cellules 

La pr&ente invention conceme egalement des vecteurs de clonage et 
25 d*expression comportant une sequence nucldotidique telle que decrite prdcedemment. 

Ces vecteurs de clonage et d*expression pourront comporter des 
elements assurant Texpression de la sequence dans une cellule h6le. notamment des 
sequences promotrices et des sequences de regulation efflcaces dans ladite cellule. 

Le vecteur en cause pouvant gtre k replication autonome ou bien destine 
30 k assurer 1 'integration de la sequence au sein des chromosomes de la cellule hdte. 

Dans le cas de systfemes k replication autonome, en fonction de la 
cellule hote, procaryote ou eucaryote, on utilisera de preference des systdmes de type 
plasmidique ou des systfemes viraux, les virus vecteurs pouvant etre notamment des 
adenovirus (Perricaudet et al. 1992), des retrovirus, des poxvirus ou des vims 
35 herpetiques (Epstein et al. 1992). L*homme de metier connatt les technologies 
utilisables pour chacun de ces virus. 



BNSDOCID: <FR 2756845A1_L> 




2756845 



9* 

Ainsi, il est connu d'utiliser comme vecteur viral des virus defeciifs dont la 
culture est effectuee dans des cellules de complementation, ceci evitant les risques eventuels 
de proliferation d'un vecteur viral infeciieux. 

Lorsque Ton souhaiiera Pintegraiion de ia sequence dans les chromosomes de 
la cellule hole, il sera necessaire de prevoir de part et d'auire de la sequence nuclcoiidique a 
integrer une ou plusieurs sequences provenant de la cellule bote afm d'assurer la 
recombinaison. II s'agit la egalement de procedes qui sont largement decrits dans la 
technique anterieure. On pourra, par exemple, utiliser des systenies de type plasmidique ou 
viral ; de lels virus serom, par exemple, les retrovirus (Temin 1986) ou les AAV, 
Adenovirus Associated Virus (Carter 1993). 

L'invention conceme egalement les cellules procaryotes ou eucaryotes 
transformees par un vecteur tel que decrit precedemmenl et ceci afm d'assurer Texpression 
d'une proteine FMO naturelle ou variante ou bien, par exemple, d*une de ses domaines. 

Comme cela a ete indique precedemmem, la presente invention conceme 
Egalement les proteines, peptides ou polypeptides obtenues par culture des cellules ainsi 
transformees et recuperation de la proteine exprimee, ladite recuperation pouvant etre 
effectuee de fa^on intracellulaire ou bien de fagon cxlracellulaire dans le milieu de culture 
lorsque le vecteur a ete con9u pour assurer la secretion de la proteine par le biais, par 
exemple, d'une sequence "leader", la proteine etant sous forme d'une pre-protcinc ou prepro- 
proteine. Les constructions permettant la secretion des proteines sont connues, aussi bien 
pour des systemes procaiyotes que des systemes eucaryotes, Dans le cadre de la presente 
mvention, certaines des proteines FMO pourront comporter leur propre systeme de secretion 
ou d*insertion membranaire. 

Parmi les cellules utilisables pour la production de ces proteines, il faut citer 
bien entendu les cellules bactcriennes (Olins et Lee 1993), mais egalement les cellules de 
levure (Buckholz 1993), de meme que les cellules animales, en particulier les cultures de 
cellules de mammifere (Edwards et Aruffo 1993) mais egalement les cellules d'insectes dans 
lesqueltes on peut utiliser des procedes mettant en oeuvre des baculovirus par exemple 
(Luckow 1993). 

Les cellules ainsi obtenues peuvent pemiettre de preparer des proteines 
naturelles ou varianies FMO, mais egalement des fragments de ces proteines, notamment des 
polypeptides pouvant correspondre aux differents domaines en cause. 

La presente invention conceme egalement les aniicorps polyclonaux ou 
monoclonaux obtenus par reaction immunologique d'un organisme humain ou animal avec 
un agent immunogene constitue soit par une proteine ou un polypeptide obtenus par culture 
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d une des cellules preccdemn^ent decri.es scion I'une des sequences fa) a m ■ 
polypepnde specifique de la for^e mutee de la proteine ob e , ^* 

Precede..enc decrit. ,a s^uence dudit polypeptide Tn chl " 

Polypep.id.quescon.prenantaumoinsunemuJon ^'^"'^""^ 
Les modf-lpc r-Mr..|.,jrf.- 

Les cellules transformees telles que decrites r^rAr^^ 
egalement etre utilisees a titre de modcle afin d'etuL . P««demment pourront 

partenaires. co^pos^s chimiques et p o Lts il, ^ '« 
ractivite FMO, et afin d'Jier les rf^Ite: 7 °" indirectement dans 

d-une FMO normale ou d^ri^^ ™ "'"^ 

appI.ationpouHas.ec.o„dep:r:.:^^^^ - 

notamment 

PO»ibUi« ..■iZ.T^TZT'T'"' " " done la 

protiine m,male o« la „ro.«„. varia,,. P " fc-Kno- de leurs to,.ractio„s avee la 

8*™ la cellule e„ catmlir^ 

.•expression de la se,„e„l™ ^« P~ 

variant. „„ d. .esj d« 1 ™0 °» 

de em,u„ desdites cellull °" " " '« ^j-"""' <^ '= 

-^.desa^Ia'alL" » — --n. 
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L'utilisation de modeles celluJaires en vue de tester des composes 
pharmaceutiques est bien connue, la encore il n'y a pas lieu de detailler ce type de modele. 
On peut cependant citer. parmi Ics techniques utilisees, le "Phage Display" (Allen et al. 
1 995), et les methodes de double-hybride (Luban et Goff. 1 995). 
:> Ces modeles peuvent etre de type in vitro, par exemple des cultures de cellules 

humaines. soit en culture normale, soit eventuellement sous forme d'organe isole. 

La presente invention conccme egalement des organismes tels que les 
animaux, en particulier des souris. exprimant le phenotype correspondant a la FMO normale 
ou variante d'origine humaine. La encore, ces animaux pourront etre utilises comme animaux 
10 modeles pour tester Tefficacitd de certains produits pharmaceuUques. 

La presente invention conceme egalement les produits obtenus par la mlsc en 
oeuvre des modules cellulaires pr^edents. 
Methode de diapnnstiV. 

La presente invention conceme, comme ccla a ete dit pr^cddemment. plus 
particuliirement des mithodes de diagnostic d'une predisposition au glaucome. notami^ent a 
des affections de type GPAO. plus particulierement GPAO-J. ou de maladies Ii6es i FMO 
Chez un patient, caiacteris<es en cc qu'on determine k partir d'un pr€Ifevcment biologique 
dudit patient la presence d'une mutation dans au moins une sequence codant pour une FMO 
par I'analyse de tout ou partie d'une sequence nucleique correspondant audit gene, la 
presence d'au moins une telle mutaUon etant indicative d'une predisposition dudit patient a 
des affections GPAO ou des maladies liees a FMO. 

II est important de preciser que la pr&ente invention ne d^crit en detail que 
hFM02 et hFMOx, mais les mithodes de diagnostic et les compositions a visees 
therapeutiques concement aussi bien les FMO precedentes que FMOl, FM03, FM04 et 
FMOS. En effet. il semble que les FMO en general interviennent dans le GPAO. 

Paxmi les mutations qui sont recherchecs, il faut citer plus particulidrement la 
mutation G. 1263mac.A.(localisee sur la Figure 6). 

Les sequences d'acidcs nucl6iques analysees pourront etre aussi bien de 
TADN genomique, un ADNc ou un ARNm. 

Comme cela a et£ dit precedemment. parmi les troubles GPAO qui peuvent 
etre mis en evidence, on entend plus particulierement le GPAO-J. mais il peut exister 
d'autres troubles qui pourraient etre lies a une anomalie des FMO. 

Les outils diagnostiqucs bases sur la presente invention, bien qu'ils puissent 
permenre un diagnostic positif et differentiel chez un malade pris isolement. seront de 
preference interessants pour un diagnostic presymptomatique chez un sujet a risque. 
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nolamment avec antecedent familial, et il est possible egalement dc prevoir un diagnostic 
ante-natal. 

En outre, la mise en Evidence d'une mutation specifique peut permettre un 
diagnostic evolutif. notamment quant i I'intensit^ de ia pathologic ou a I'epoque probable de 
son apparition. 

Les methodes permenant de mettre en evidence la mutation dans un gene par 
rapport au gine naturel sont. bien entendu, tres nombreuses. On peut essentiellement les 
diviser en deux grandes categories, le premier type de mdthode est celui dans lequel la 
presence d'une mutation est detectie par comparaison de la sequence mutee avec la sequence 
correspondante naturelle non mut^e, et le second type dans lequel la presence de la mutation 
est detectee de fa9on indirecte. par exemple par la mise en evidence de misappariements dus 
a la presence de la mutation. 

Dans les deux cas, on preferera en general les mithodes dans Icsquelles tout 
ou paitie de la sequence correspondant i FMO est amplifiee prealablement a la mise en 
evidence de la mutation, ces methodes d'amplification pouvant 6tre realises par des 
methodes dites PCR ou PCR-like. Par PCR-like on entendra designer toutcs les mdthodes 
mettant en oeuvre des reproductions directes ou indirectes des sequences d'acides nucl6iqucs, 
ou bien dans lesquelles les systemes de marquage ont ete amplifies, ces techniques sont bien 
entendu connues. en general il s'agit de I'amplification de I'ADN par une polymerase ; 
lorsque Tichantillon d'origine est un ARN il convient prealablement d'effectuer une 
transcription reverse. II existe actuellement de tres nombreux procedes permettant cette 
amplification, par exemple les methodes dites NASBA "Nucleic Acid Sequence Based 
Amplification" (Compton 1991), TAS "Transcription based Amplification System" (Guatelli 
et al. 1990). LCR "Ligase Chain Reaction" (Landegren et al. 1988). "Endo Run 
Amplification" (ERA), "Cycling Probe Reaction" (CPR). et SDA "Strand Displacement 
Amplification" (Walker et al. 1992). bien connues de Thomme du metier. 

Le Tableau 1 presente des sequences d'amorces utilisables pour amplifier les 
sequences interessant la mutation G.1263mac.A. 

Le reactif utilise pour d^tecter et/ou identifier une mutation du gene FMO 
dans un echantillon biologique comprend une sonde dite de capture et/ou une sonde dite de 
detection. I'une au moins de ces sondes comportant une sequence selon la presente invention 
decrite precedemment. 
Recherc he de mutations poncluelles 
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De fa9on generale. plusieurs methodes de detection peuvent etre appliquees ou 
adaptees s. nccessaire. apres amplification des sequences d'interet par PCR A titre 
d exemples, on peut citer: rv.iv. mre 



1) Sequen9age: comparaison des sequences de plusieurs imlividus et/ou reperage d'un site 
d heterozygolie chez un seul individu. 

2) "Single nucleotide primer extension" (Syvanen et al. 1990). Des exemples d'amorces 

Tab"au 2. ^ ""^ ^ 

!i^''''K',''''''"!i'" Polymorphism". Un exemple d'enzyme de restriction 

uuhsable pour detecter la mutation G. 1263mac. A. par RFLP est preseme sur le Tableau 3 

4) Recherche de 'Smgle Strand Confomiation Polymoiphisms" (SSCP) 

5) Methodes basees sur un clivage des regions misappariees (clivage enzymatique par la SI 
nuclease, chvage chimique par differems composes tels que la pipdridine ou Ic tdtroxide 
d osmium, etc. 

6) Mise en evidence d'hitdroduplex en electrophor^se. 

7) MeAodes basees sur I'uUlisation en hybridation de sondes oligonucWotidiques specifiques 
d alleles: "Allele Specific Oligonucleotide" (ASO) (Stoneking et al. 1991). Des exemples 
leVlT«u 4 "^"^ " G-1263mac.A. par ASO figurent sur 

8) Methode OLA "dual color Oligonucleotide Ligation Assay" (Samiotaki et al. 1994) 

9) Methode ARMS "Amplification Refiacton. Mutation System" . ou ASA "Allele Specific 
Amphfication". ou PASA "PGR Amplification of Specific Allele" (Wu et al 1989) 

etreutilisees. P^"^*'"^ 
l^echerche de remaniem^ntc p ar exemplP type deletions 

P,.w. A f '""^^ techr^iques d'hybridation a 

I aule de sondes genomiques, de sondes ADNc. de sondes oligonucleotidiques ou de 
nbosondes peuvent etre utilisies pour la recherche de ce type de remaniements. 
Meth0de$ basees sur la Ae-it^i ^g du prndin> ^ „ 

modificat "1' ""r"""" ''''^ ^""'"^ responsables de differentes 

modzficafons du produ.t de ce gene, modifications utilisables pour une appn^che 
d.agnost.que. En effet, les modifications d'antigenicite peuvent permettre la mise au poim 
d anfcorps specifiques. Toutes ces modifications peuvent etre utilisees en approche 
d.ag„ost.que, grace a plusieurs methodes bien connues basees sur I'utilisation d'anticorps 
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mono ou polydonaux reconnaissant la proteine nomtale ou des variants mutes, par exemole 
methode RIA ou ELISA. '^^'cmpie 

La presente invention conceme egaiement les anticorps monoclonaux ou 
polydonaux marques et correspondant i tout ou partie des proteines mutees afm de servir 
d agent d'.magene, in vivo ou ex vivo sur des prelevements biologiques (imagerie i I'aide 
d anticoqjs couples a une molecule detectable en imagerie de type PET-scan. par exemplc) 

Enfm, il est egaiement possible de diagnostiquer une predisposition au 
glaucome. notamment a une affection de type GPAO. plus particulieremeat GPAO-J ou a 
des maladies liees h FMO. chez un patient, en mesurant I'activite enzymatique de la (ou des) 
FMO a partir d'echantillons biologiques dudit patient. La mesure de cette (de ces) activit6(s) 
par comparaison avec un etalon. interne ou exteme. sera en cffet indicative d'une 
predisposition a I'une des pathologies precedemment citees. 
Compositions therapeutiques 

La prdsente invention conceme egaiement les traitements therapeutiques 
curatifs ou pr6ventifs. du glaucome, notamment du type GPAO. en particulier du GPAO-j' 
ou de maladies liees k FMO. 

Comme cela a 6ti rappeld precedemment. le diagnostic precoce de GPAO-J 
permet un traitement efficace. notamment par chirurgie. neamnoins il peut atre im<ressant de 
disposer d'un traitement pr^ventif ou curatif non chirurgical. 

On pourra utiliser les composes impliques directement ou indirectement dans 
I'activite FMO. issus de I'miiisation des modeles cellulaires decrits precedemment. 

On pourra particulierement utiliser les composes capables d'interagir avec les 
FMO, nomiales ou variantcs, a titre d'agoniste ou d'antagoniste notamment. 

La presente invention conceme egaiement des compositions therapeutiques 
comportant a titre de principe actif un compose capable de moduler I'activite FMO il peut 
s'agir de composes a activite pro-FMO. notamment tels que decrits precedemment,' ou des 
composes a activite anti-FMO. 

De fa^on generale. on entendra par "activite pro-FMO" un compose qui 
mduira I'activite FMO. au contiaire un compose anti-FMO aura tendance a reduire I'activite 
FMO. L'effet rfel de ces types d'activites dependra du type d'enzyme exprimee. nom«le ou 
pathologique. 

De fa9on preferee, on pourra utiliser des compositions therapeutiques dont 
Tactivue sera differente envers les enzymes FMO normales et variantes. 

II est tout d'abord possible de prevoir un traitement de substitution, c'est-a- 
dire des compositions therapeutiques caractcrisees en ce qu'elles comportent a titre de 
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pnncpe acuf un compose a activite pro-FMO; il pourra s'agir notamment de tout ou paxtie 
d un polypeptide tels qu'ils ont ete decrits precedenunent ou bien d'un vecteur d'expression 
de ces memes polypeptides, ou bien encore de composes chimiques ou biologiques ayant une 
activite pro-FMO. une activite FMO-like ou induisant la production de FMO. 

II est possible egalement d'utiliser des compositions therapeutiques dans 
lesquelles le pnncpe actif aura une action anti-FMO. en particulier anti-FMO variants Dans 
ce cas ,1 s-agn d'un traitement suppressif. II pourra s'agir. par exemplc. de composes 
mteragtssant avec lesdites enzymes, notamment des composes proteiques. et en paniculier 
d anttcorps anti-FMO. notamment lorsque ces anticorps reconnaitront les protdines variantes 
II pourra s'agir egalement de produits chimiques ayant une activite anti-FMO. notamment 
des antagonistes de FMO variante. 

Parmi les nombreux composes pharmaceutiques utilisables. il faut citer plus 
particuherement. les sequences anti-sens interagissant avec le gene FMO normal ou mute ou 
b.en les sequences sens agissant sur la regulation de I'expression de ces genes, lesdits 
produits pouvant Egalement interagir en aval des produits d'expression induits par les FMO. 

II faut egalement mentionner les anticoips monocionaux bloquant les FMO en 
pamculier les FMO mutdes. et/ou bloquant les iigands correspondants et/ou les piodLits 
mduits par I'activite FMO. qui peuvent done avoir des activites pro ou anti. 

II est egalement possible de prevoir I'expiession de proteines ou leurs 
fiagments m vivo, notamment par le biais de la therapie genique et en utilisant les vecteurs 
qui ont €t6 decrits precedemment. 

Dans le cadre de la therapie gdnique. il est possible egalement de prevoir 
1 utilisation des sequences des genes ou des ADNc precedemmem decrits. "nus". cette 
technique a notamment ete developpee par la societe Vical. qui a montr<5 qu'il etait dans ces 
conditions, possible d'exprimer la prot^ine dans certains tissus sans avoir recours au support 
d un vecteur viral notamment. 

Toujours dans le cadre de la therapie genique. il est egalement possible de 
prevotr 1 utUisation de cellules tramfomiees ex-vivo, lesquelles pourrom etre ensuite 
retinplantees, soit telles quelles. soit au sein de systemes de t>pe organoide. tel que cela est 
egalement connu dans I'etat de la technique (Danos et al. 1993). On peut egalement 
envisager Putiiisation d'agents facilitant le ciblage d'un type cellulaire determine, la 
penetration dans les cellules ou le transport vers le noyau. 
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D/.autre&»caract^ristiq.ues et avantages de 1^^ grj^spate. inveation 
apparaitront h la lecture des exemples ci-aprte, faite en se r6f6rant aux dessins annexes 
suivants : 

Figure 1 : Sequence peplidique pr^dite de hFM02. homologue humaine de la 
5 FM02 de macaque 

Figure 2 : Sequence nucltotidique du gdne codani pour hFTvI02, homologue 
humaine de la FM02 de macaque. 

Au vu des homologies des ARN messagers connus de g^nes de la famille des 

monooxygdnases k flavine, ces gfenes partagent la mSme structure exon/intron : 
10 exon 1 : non traduit , variable en taille et en s&)uence 

exon2 : d^but de la region codante , code pour les acides amines 1-44 

exon3 : acides aminds 45-107 

exon4 : acides amin^ 108-161 

exonS : acides arnin^ 162-209 
15 exon6 : acides amines 210-275 

exon7 : acides amines 276-394 

exonS : acides amines 395-419 

exon9 : acides amin& 420-535 fin du codant et region non traduite 3' 

Les introns sont variables en taille et en complexity. 
20 Nous poss^dons la sequence de trois fragments du BAC 123H04M qui 

contiennent la totality des exons de cet homologue, Les sequences de deux introns 

sont encore k compiler : 

Fragment 1: contenant les exons 1 et 2 

Fragment 2 : contenant Texon 3 
25 Fragment 3 : contenant les exons 4 k 9, 

Figure 3 : Description de la structure exon/intron du gfene codant pour hFM02, 

homologue humaine de la FMQ2 de macaque 

Sont indiquees les structures des sites d'dpissage en 5' et 3\ ainsi que les 
positions des debuts et fins d'exons sur la sequence nucl^otidique pr^sentde en 
30 Figure 2. 

Figure 4 : Homologie entre le gfene FM02 de macaque et son homologue humain 
La region 5' non traduite diverge l^g^rement de la sequence de macaque. 
Figure 5 : Relev6 des positions variantes de la sequence de I'ARNm de hFM02 
humain par rapport k la sequence homologue de macaque; influence des variations 
35 sur la sequence protdique. 
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Figure 6 : Homologies entre les sequences d'ARMm de la FM02.de macaque et 
de son homologue humaine. 

La position de la mutation G. 1263mac.A est rep^r^e par une flfeche verticale. 
Figure 7 : Homologies entre les sequences peptidiques de la FM02 de macaque et 
5 de son homologue humaine. 

Figure 8 : Analyse de la segregation du polymorphisme G.1263mac.A dans la 
famille 6tudi6e. 

L'ADN g^nomique des individus 3, 4, et 7 i 14 a 6i6 amplifid par PGR, et la 
sequence des fragments obtenus analysde pom d^tecter des sites d'hdterozygotie 
10 s^gr^geant avec la maladie. 

Les symboles pleins indiquent les individus atteints du GPAO juvdnile. Les 
symboles barrds indiquent des individus non genotypes. Les individus 11 et 12 
sent des jumeaux« 

G/G =homozygotes pour la base en position homologue de la position 1263 de 
15 1 ' ARNm de la FMQ2 de macaque 

G/A= het^rozygotes pour la base en position homologue de la position 1263 de 
I'ARNm de la FM02 de macaque. 

Figure 9 : Localisation chromosomique du BAC123H04M par hybridation in situ 
fluorescente. 

20 (A)Un signal spdcifique est observe sur les deux chromosomes L Sur la photo 
(B) est represents un seul des deux chromosomes 1. En (C), seules les bandes R 
de ce chromosomes sont observees, montrant que le signal de la sonde 123H04M 
est localise sur la bande lq23. 

Fi gure 10 : Sequence nucieotidique du gfene codanl pour Tisoforme hFMOx 
25 humaine. 

Ce gfene presente un taux d'homologie de 75% en ADN et de 70% en acides 
amines avec les ARN mcssagcrs dc monooxygenases k flavine presents sur le 
BAG 123H04M, II est presente en quatre fragments : 

- fragment 1 : code pour Texon 2 (premier exoh codant) 
30 - fragment 2 : exon 3 

- fragment 3 : exons 4^8 

- fragment 4 : exon 9. 
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Les localisations des exons sont prpbablement les suivantes : . , , . ^ 
noexons AA position fragment position fragment 

d^but fin 





exon2 


1-44 


1#6573 


1#6704 


5 


exon3 


45-107 


2# 2203 


2#2400 




exon 4 


108-162 


3# 743 


3# 910 




exon 5 


162-210 


3# 2015 


3#2161 




exon 6 


209-277 


3#3956 


3# 4162 




exon? 


278-392 


3#6314 


3#6658 


10 


exon 8 


395-420 


3#8545 


3#8616 




exon 9 


421-530 


4#4689 


4# 5050. 



EXEMPLES 

Isolement du BAG 123H04M 

15 Afin d'identifier un gfene impliqu^ dans le d^veloppement du glaucome, 

on a isol6 un BAG (" Bacterial Artificial Chromosome ") correspondant k la rdgion 
candidate pr6c6demment localis^e sur le chromosome 1. Una banque de BACs 
couvrant le genome humain complet a 6i6 pr^parde k partir de I'ADN d'une lignde 
lymphoblastique humaine d6riv6e de Tindividu n'*8445 des families du GEPH. Gette 

20 lignfe a 6i6 utilis^e comme source d'ADN de haut poids mol^culaire. L'ADN a 6t6 
partiellemenl dig6r6 par I'enzyme de restriction BamHl, puis clone au site BamHl du 
plasmide pBeloBacII. Les clones ainsi obtenus ont 6i€ "pool&s" et cribles selon une 
procedure d'analyse tridimensionnelle precddemment decritc pour le criblage des 
banques de YAGs (" Yeast Artificial Chromosome **) (Ghumakov et al. 1992). Les 

25 pools tridimensionnels obtenus ont 6i6 cribles par PGR k Taide des amorces encadrant 
le marqueur D1S3423(WI- 10286). Ce STS ("Sequence Tagged Site ") avait 6i6 
pr^&lemment localise dans la region candidate par Belmouden et al. 1996. Un clone 
du BAG 123H04M a 6t6 ainsi isol^. 

Apr6s digestion par i'enzyme de restriction Notl. la taille de Tinsert 

30 pon6 par ce BAG a 6i6 d^terminde sur un gel d'agarose 0,8% aprfes migration par 
^lectrophorfese en champ altem6 (CHEF) (4 heures k 9Volts/cm, avec un angle de 
100^. k 1 rC en tampon 0,5xTAE). On a ainsi mis en Evidence que le BAG 123H04M 
porte un insert de 180 kb. 

35 
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Localisation chromosomiQue dn RAC 123H04M par hybridation iftsitu..nu»rft^^nt^ 
rHSH) 

La Icjcalisation chromosomique du BAG dans la region candidate lq23- 
q25 a 6t6 confirmee par hybridaUon in situ nuorescente (HSH) sur chromosomes 
5 m6taphasiques, selon la mdthode d&rite par Cherif et al. 1990. Le BAG 123H04M a 
6t6 localise plus pr^cisdment dans la bande lq23 du chromosome 1 (Figure 9). 
S&iuencage de Tinsert du BAG 123H04M 

Afin de sequencer 1 'insert du BAG 123H04M. on a pr6par6 trois 
banques distinctes de sous-clones k partir de I'ADN soniqu^ de ce BAG. 
10 Les cellules issues de trois litres de culture " overnight " ont 6t6 trait^es par lyse 
alcaline selon les techniques classiques. Apr6s centrifugation du produit obtenu dans 
un gradient de chlorure de cdsium, 52f,g d'ADN du BAG 123H04M ont 616 purifies. 
7j4g d'ADN ont 6t6 soniqu^s dans trois conditions diffdrentes. afin d'obtenir des 
fragments dont les tallies se distribuent uniform6ment de 1 i 9kb. Les fragments 
15 obtenus ont 6t6 trait^s dans un volume de 50 fil avec 2 unites de Vent polymerase 
pendant 20 minutes 70»G. en pr&ence des 4 d^oxytriphosphates (I00;<M). Les 
fragments aux extr6mit6s franches resultant de cette ^tape ont 6t6 s^pards par 
eiectrophor^e en gel 1% d'agarose k bas point de fusion (60 Volts pendants heures). 
Les fragments group^s selon leurs tailles ont 6t6 excisfe et les bandes obtenues trait&s 
20 par 1 'agarase. Apr^ extraction au chloroforme et dialyse sur colonnes Microcon 100, 
I'ADN en solution a 6t6 ajustd k une concentration de I00ng//<1. Une ligation a 6t6 
effectu^e " overnight " en mettant en presence lOOng de I'ADN fragment^ du BAG 
123H04M et 20ng d'ADN du vecteur linearis^ par digestion enzymatique. et traite par 
la phosphatase alcaline. Cette reaction 6 €16 r&lis^e dans un volume final de 10 {aX en 
25 pr&ence de 40 unites ///I de T4 ADN ligase (Epicentie). Les produits de ligation ont 
ensuite servi k transfomer par ^lectroporation, soit une souche XL-Blue (pour les 
plasmides multicopies), soit une souche DlOHB (pour les sous-clones issus du BAG). 
Les clones lacZ- et r&istants k Tantibiotique. ont 6t6 repiqufe individuellement en 
microplaques pour stockage et sdquen9age. 
30 On a ainsi obtenu : 

- 864 sous-clones issus de insertion de fragments de 2 a 3 kb au site Smal du 
plasmide puclS ; 

- 1728 sous-clones correspondant k I'insertion de fragments de 1,5 i 2 kb au site 
BamHI (rendu franc) du plasmide BluescriptSK ; 

35 - 288 sous-clones portant des fragments de 4 a 7 kb insdr^s au site Pmll d'un 
vecteur BAG modifi^. 
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Les inserts^ de. ces sousrclones ont 6i6 amplifi^ gar..PCR sue cultures, 
bact^riennes conduites " overnight en utilisant les amorces des vecteurs flanquant les 
insertions. La sequence des extrdmit^s de ces inserts (en moyenne 500 bases de 
chaque c&i6) a 6i6 d^lerminde par sdquenfage automatique fluorescent sur sdquenceur 
5 ABI 377, 6qmp6 du logiciel ABI Prism DNA Sequencing Analysis (version 2. 1.2). 

Les fragments de sequence provenant des sous-BACs ont 6i6 assembles 
par le logiciel Gap4 de R. Staden (Bonfield et al. 1995). Ce logiciel permet la 
reconstruction d'une sequence complete ^ partir de fragments de sequences. La 
s&iuence ddduite de Talignement des differents fragments est la sequence consensus. 

10 On a enfin utilise des techniques de sequen9age dirig6 (marche systdmatique de 
I'amorce) pour parfaire les sequences et relier les contigs. 
Analyse des sequences 

Les exons potentiels du BAC 123H04M ont 6i6 rep^rds jmr recherche 
d'homologie sur les banques publiques de protdines, d'acides nucleiques et d'EST 

15 (Expressed Sequence Tags). 
Banaues de donnees: 

On a utilisd des refontes locales des principales banques publiques. La 
banque de prot^ines utilisde est constitute par la fusion non redondante des banques 
Genpept (traduction automatique de GenBank, NCBI; Benson et al. 1996); Swissprot, 

20 (George et al. 1996); et PIR/NBRF (Bairoch et al. 1996). Les doublons ont €i€ 
dlimin^s par le logiciel "nrdb" (domaine public, NCBI; Benson et al. 1996). Les 
repetitions internes ont ensuite €l€ masquees par le logiciel **xnu" (domaine public, 
NCBI; Benson et al. 1996) . La banque rdsultanie, ddnommde NRPU (Non- 
Redundant Protein- Unique) a servi de rdfdrence pour les recherches d'homologies 

25 prot^iques. Les homologies trouvdes avec cette banque ont permis de localiser des 
regions codant potentiellement pour un fragment de prot^ine au moins apparent^ ^ une 
protdine connue (exons codants). La banque d'EST utilisde est comfXDsde des sous- 
sections "gbest" (1-9) de Genbank (NCBI; Benson et al. 1996). Elle contient tous les 
fragments de transcrits publics. 

30 Les homologies trouv6es avec cette banque ont permis de localiser des 

regions potentiellement transcrites (prdsentes sur TARN messager). 
La banque d'acides nucldiques (autres que les EST) utiliste contient toutes autres sous- 
sections de Genbank et de TEMBL (Rodriguez-Tome et al. 1996) dont les doublons 
ont €l€ dlimin€s comme pr^c^emment. 

35 
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On a utilise rensemble de logiciel BLAST (domaine public, Altschul et 
al. 1990) de recherche d'homologies entre une s^uence et des banques de donn^es 
prot^iques ou nucl^iques. Les seuiis de signification dependent de la longueur et de la 
5 complexity de la region test^ ainsi que de la taille de la banque de r^f^rence. lis ont 6t6 
ajust^s et adaptds k chaque analyse. 

Identification de polvmorp hismes associ^s au GPAQ-J. maladie de transmission 
autosomale dominante flocusGLCiA) 
Detection de Polvmorphismes/Mutations 
10 1) Extraction de TADN 

L'ADN est extrait du sang veineux p^riph^rique aprds lyse cellulaire. 
digestion prot^ique, partition organique et finalement pr6cipitation alcoolique. 
Le sang (20 ml) est pr^levd par ponction veineuse p^riph^rique sur un tube contenant 
de I'EDTA. 

15 II est dilu6 avec un volume d'eau bidistill^e. Aprds 10 minutes, les 

cellules sont collecttfcs par centrifugation k 1600 g pendant 10 minutes. Cette 
manipulation est T6p6t€c. 

Les cellules blanches sont lysdes en prince de 20 ml de tampon CLB 
(Tris 10 mM pH 7.6, 5 mM MgCl2. sucrose 0.32 M. Triton X-100 1% (v/v). Les 
20 noyaux sont collect^s par centrifugation k 1600 g pendant 10 minutes. Cette 
manipulation est T6p6t6e. 

Les noyaux sont lavds une fois dans le tampon RSB (Tris 10 mM pH 
8. NaCl 10 mM, EDTA 10 mM). Le culot est resuspendu dans 2 ml de tampon RSB 
auquel est ajout6 du lauryl sulfate de sodium (1%) et la proteinase K (200 mg/ml). Le 
25 melange est incubd k 55°C pendant au moins 3 heures et r^guliferement agit€. 

La solution d'ADN ainsi obtenue est ensuite extraite avec un volume de 
phenol 6quilibre avec un tampon 50 mM Tris pH 8. Cette opdiation est T€p6t6t et 
compl^tde par une extraction avec un volume de chloroforme /alcool isoamylique 
(24:1 v/v). 

L'ADN est pr^cipit^ avec un volume d'isopropanol , rinc6 k I'ethanol 
(70 %), sechd et enfin resuspendu dans I ml de tampon TE (Tris 10 mM pH 8, EOTA 
0.5 mM). La concentration d'ADN est ^valu^e par mesure de I'absorbance k 260 nm 
en utilisant I'gquivalence de 50 ftg/ml d'ADN pour une unite d'absorbance. La 
concentration d'ADN est alors ajustee k 200 ;<g/ml. 

35 
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2) Ampjification de TADN g^iipmique ^ .s, 

Les amorces oligonucMotidiques utilis6es pour I 'amplification 
g^nomique des sequences exoniques d6nv6es du BAC 123H04M, telles que pr^dites 
par analyse informatique, ont 6\6 d^finies k Taide du logiciel OSP (Hillier et al. 1991). 
5 Toutes ces amorces contiennent, en amont des bases specif iquement cibl^es par 
ramplification, une queue oligonucldotidique commune, destin6e ^ permettre le 
s^uenfage des fragments amplifies (PU pour les amorces en amont, et RP pour les 
amorces en aval; sequences expose sur le Tableau 5). 

Les amorces oligonucltotidiques ont 6t6 synthdtisees selon la mdthode 
10 des phosphoramidites, sur un synth6tiseur GENSET UFPS 24. 1. 

L'amplification de chaque sequence exonique prddite a 6i6 rdalisde par 
reaction d'amplification en chaine par polymdrase (PGR), dans les conditions 
suivantes: 

Volume final 50 jaI 

15 ADN g^nomique 100 ng 

MgCl2 2mM 
dNTP (pour chacun) 200 jaM 

Amorce (pour chacune) 7.5 pmoles 

AmpliTaq Gold DNA polymerase (Perkin) 1 unitd 

20 Tampon de PCR ( 10X=0. 1 M Tris HCl pH 8.3, 0.5 M KCl) 1 X 

L^amplification est r6alis6e dans un thermocycleur Perkin Elmer 9600 
ou MJ Research PTC200 avec couvercle chauffant. Aprfes un chauffage h 94^*0 
pendant 10 minutes, 35 cycles sont effectu6s. Chaque cycle comprend : 30 secondes k 
94*C. 1 minute k 55'*C et 30 secondes k 72^C. Un segment final d'dlongation de 7 
25 minutes k 72^C termine Tamplification. 

La quantity de produits d'amplification obtenue est dcterminde sur 
micro-plaque de 96 puits, par fluoromdtrie, utilisant Tagent intercalant Picogreen 
(Molecular Probes). 

3) Detection des polymorphismes/mutations 
30 - Sequence 

Les produits de Tamplification g^nomique par PCR ont 6i6 sdquencds 
sur sdquenceur automatique ABI 377, en utilisant des amorces fluorescentes marqudes 
par les fluorochromes ABI (Joe, Fam. Rox et Tamra) et TADN polymdrase 
Thermosequanase (Amersham). 

35 
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Les rations ont ^t^ r^is^s en microplaques de 96, puitsvisui:, 
thermocycleur Perkin Elmer 9600. dans des conditions classiques de cycles de 
temperature: 

- 8 cycles: d^naturaUon: 5 sec. a 94"C; hybridation: 10 sec. ; Elongation: 30 sec. a 
5 72»C. puis 

13 cycles: ddnaniration: 5 sec. h 94"'C; Elongation: 30 sec. & 72'C. 

6 unites de Thermosequanase, et 5-25 ng de produit d'amplification 
ont €t6 utilises par reaction de sequence. 

A Tissue des cycles d'amplification, les produits des reactions de 
10 sequence sent prEcipitds dans I'dthanol, resuspendus dans du tampon de charge 
contenant de la formamide. ddnaturEs. et dEposEs sur gels d'acrylamide 4%; les 
Electrophoreses (2 heures 30 k 3000 Volts) sont conduites sur sEquenceurs ABI 377 
EquipEs des logiciels ABI de collection et d'analyse (ABI Prism DNA Sequencing 
Analysis Software, version 2.1.2.). 
1 5 - Analyse des sEquences 

Le GPAO-J Etant une maladie autosomale dominante. les donnEes de 
sEquence obtenues ont EtE analysEes afin de dEtecter la prEsence de sites 
d'hetErozygotie parmi les patients atteints de glaucome juvEnile. Les sites 
d'hEtErozygoUe ont EtE confirmEs aprEs comparaison des sEquences des deux brins 
20 d'ADN gEnomique de chaque individu concemE. Un site d'hEtErozygotie est retenu 
comme mutation candidate responsable de la survenue du glaucome juvenile s'il est 
prEsent chez tous les membres malades d'une meme famille, alors qu'il est absent chez 
les contrdles sains. 
- REsultats 

^rmi tous les fragments d'amplification d^rivEs du BAC 123H04M 
dtudiEs. run d'entre eux prEsente un site d'hEtErozygotie sdgrEgeant avec la maladie 
dans un pedigree reprEsentE sur la Figure 8 . 

Ce site d'hEtErozygotie (G/A) est prEsent chez 7 malades atteints de 
GPAO-J. tandis qu'il est absent de 3 contrdles sains issus de la mSme famille. 
30 homozygotes (G/G). De plus. 99 contrdles sains non apparentEs sont de mfime 
homozygotes (G/G) pour ce site, indiquant que la frEquence de I'allfele A dans la 
population gen^rale est infErieure k 0.005. 

Le site est contenu dans I'exon 8 du gEne codant pour la protEine 
hFM02 selon I'invention; la mutation dEcrite transfomie I'acide glutamique en position 
35 402 de la hFM02 en lysine (Figure 1). 
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Le.calcul,jdes. Lod^ scores, integrant les donn^es. pt^c^deme&v ppur, 
diffdrentes hypothfeses de frequences de chaque alldle dans la population g^ndrale, 
indique une probability supdrieure k 100 contre 1 que rhdterozygotie (G/A) d&rite soit 
U6c au GPAO-J (Tableau 6).CeUe probability est significative du fail que I'analyse a 
5 port6 sur une seule famille. 

Les amorces ayant pennis ramplificaiion du fragment d'ADN contenant 
ce site d'h^ tdrozygotie sont d&rites dans le Tableau 1 . 

Tableau 1: Sequences des amorces utilisdes pour amplifier la rdeion exonioue ddrivde 
10 du BAG 123H04M et contenant un site d'hytdTozygotie li^ au GPAO iuvdnile 

1-ocus Amorces Sequence Taille du fragment 

amplifld 

FM02/Exon 8 Amont PU 5TCACATAGAGTGCTATGGGGG 420 
15 Aval RP 5*CTTAGGAAGAAGATAAAAATGCAAC 



Tableau 2: Exemples d'amorces pour ddtecter la mutation G. 1263mac.A par "Single 
Nucleotide Primer Extension" 

20 

a) 5' AATGTCCATCATCATAGTTCTCT 3' (antisens) 

et/ou 

b) 5* TAGGCTTGTGTAGCCTGCCCrCA 3' (sens) 

25 

Tableau 3: Identification de la mutation G.1263mac,A par RFLP 



5* CC CTCAG \GAGAA 3' "normal" 
30 siteDdel (CTNAG) 

5' CCCTCAaAGAGAA 3' "mutant" 
pas de coupure 

35 
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Table^^ 4; Example de sondes tx>ur la detecti on de la mutation G.1263mac.A..par la 
technique ASO 

Sp&ifique de Tallfele G 

5 

5- CCrO^GAGAACTAT 3' et sa compldmentairc: 
3' GGAGTjCjrCTCTTGATA 5' 
10 SpdcifiquederallfeleA 

5- CCTCiAg\GAGAACTAT 3' et sa compldmentairc 
3' GGAGTTTCrCTTGATA 5' 



15 



20 



Tableau 5 

S&|upnce des antioroes utilises uour le s^uenyape des fragments d'amplification j> 
partir d'ADN egnomique 

PU 5' TGTAAAACGACGGCCAGT 
RP 5' CAGGAAACAGCTATGACC 



. Tableau 6 

Lod score entre le polvmorphisme G.1263mac A et ie GPAO juvenile dans la famill^ 
2^ ^tudi^e en fonction de la frdouence dca deux allfeles dans la population edn^rale 



Freauence de I'aliele rare (A^ 


eftaux de recombinaison) 


Lod score 


0.01 


0 


2.07 


0.001 


0 


2.10 


0.0001 


0 


2.10 


0.00001 


0 


2.10 



30 
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REVENDICATIONS 



1) Sequence nucltotidique isol6e, caractdris^e en ce qu'elle est choisie 

panni : 

5 (a) les sequences codant pour la prot6ine FM02 ou FMOx humaine et leurs variants 
prot^iques, 

(b) les sequences codant pour un fragment de Tune de ces prot^ines ayant au moins 
10 bases, 

(c) les sequences gdnomiques FM02 ou FMOx humaines et leurs alleles, 

10 (d) les sequences prdsentant au moins 90% d*homologie avec les sequences (a) et 
(c); 

(e) les fragments des sequences (c) ou (d) ayant au moins 10 bases. 

(f) les sequences qui s*hybrident avec une sequence de (a) k (e). 

2) S&)uence nucltotidique caract^ris^e en ce qu*elle est choisie parmi : 
IS (a) les sequences codant pour un polypeptide comprenant les amino-acides selon la 

s6quence de la figure 1, 

(b) les sequences nucldiques correspondant k la figure 2 ou ^ la figure 10 ou codant 
pour le polypeptide correspondant, 

(c) un fragment d*une s^uence selon (a) ou (b) comportant au moins 10 bases, et 
20 (d) une sequence qui comporte par rapport aux sequences (a), (b) ou (c) au moins 

une mutation ponctuelle. 

3) Sequence nucldotidique selon Tune des revendications 1 ou 2 , 
caract^risde en ce qu*elle comprend au moins la mutation G. 1263mac. A. 

4) Sequence nucldotidique selon Tune des revendications 1 i 3, 
25 caractfirisee en ce qu^elle comporte au moins 10 bases. 

5) Sequence nucleotidique utilisable notamment comme amorce 
spdcifique d'un allele caract6ris£ en ce que sa sequence est choisie parmi les sequences 
selon la revendication 4. 

6) Sequence nucleotidique utilisable notamment comme amorce 
30 nucl^ique caractdrisde en ce que sa sequence est choisie parmi les sequences selon la 

revendication 4 et les sequences des Tableaux 1 et 2. 

7) S&iuence nuclfotidique utilisable notamment comme sonde spdcifique 
d'un allMe caractdris^e en ce que sa s^uence est choisie parmi les sequences selon la 
revendication 4 et les s&iuences du Tableau 4. 

35 8) Sequence nucldotidique selon la revendication 1, caract^ris^e en ce 

que la sequence code pour Tim des domaines de FMO. 
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9) Vecteur de clonage ou d'expressiop dans .une cellule,.tiaie aRBrogri^e 
d'une sequence nucl6otidique, caract^risd en ce qu'il comporte une sequence selon Tune 
des revendications 1 &3 et8. 

10) Vecteur selon la revendication 9, caractdris6 en ce qu'il comporte les 
^l^ments peimettant rexpression et/ou la s&i^tion desdites sequences dans ladite cellule 
hote. 

1 1) Vecteur selon Tune des revendications 9 et 10. caract^ris^ en ce quMl 
s'agit d'un vecteur k replication autonome. 

12) Vecteur selon Tune des revendications 9 et 10. caracttfrisd en ce qu*il 
s'agit d*un vecteur d'intdgration chromosomique. 

13) Vecteur selon Tune des revendications 9 et 10. caracterisd en ce qu*il 
s*agit d*un vecteur viral. 

14) Vecteur selon la revendication 13, caract^risd en ce que le vecteur est 
r^isd sur la base d'un adenovirus, d'un AAV, d'un retrovirus, d'un poxvirus ou d'un 
virus herpdtique. 

15) Cellule U^sformde par un vecteur selon I'une des revendications 9 h 

14. 

16) Cellule selon la revendication 15, caractdrisee en ce qu'il s'agit 
d'une cellule procaryote. 

17) Cellule selon la revendication 15. caract6ris6e en ce qu'il s'agit d'une 
cellule eucaryote. 

18) Precede de production d'une proteine correspondant k Tune des 
sequences (a) k (0 selon les revendications 1 h 8, caracterise en ce qu'on cultive une 
cellule selon Tune des revendications 15 k 17 et en ce que Ton recup^re la proteine 
produite. 

19) Proteine ou polypeptide susceptibles d'etre obtenus par la mise en 
oeuvre du procede selon la revendication 18. 

20) Polypeptide specifique de la forme mutee de la proteine selon la 
revendication 19. caracterise en ce que sa sequence est choisie parmi les sequences 
polypeptidiques comprenant au moins une mutation. 

21) Composition therapeutique caracterisee en ce qu'elle comporte k titre 
de principe actif au moins un compose capable de moduler Tactivite FMO. 

22) Composition therapeutique selon la revendication 21, caracterisee en 
ce que le principe actif est capable de moduler Tactivite FM02 et/ou FMOx. 

23) Composition therapeutique caracterisee en ce qu'elle comporte k titre 
de principe actif au moins un compose capaWe d'interagir avec FMO. 
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24) Composi tion. therapeutique selpn la reveiidicatioa 23^caract6ns6c. en. 
ce que le principe actif est capable d'interagir avec FM02 et/ou FMOx. 

25) Composition therapeutique selon Tune des revendications 21 ^ 24, 
caracieris6e en ce qu'elle pr6sente une activity diff^rente sur FMO normale et FMO 

5 pathologique. 

26) Composition therapeutique selon Tune des revendications 21 ^ 25, 
caracterisee en ce qu'elle comporte k litre de principe actif un compost h activity pro- 
FMO. 

27) Composition selon la revendication 26, caracterisee en ce que le 
10 compose h activity pro-FMO est une proteine ou un polypeptide selon la revendication 

19. 

28) Composition selon la revendication 26, caractdrisee en ce que le 
compose k activite pro-FMO est un vecteur d*expression selon Pune des revendications 
9 a 14. 

15 29) Composition selon la revendication 26, caracterisee en ce que le 

compose k activite pro-FMO est une s^uence sens induisant la production de FMO. 

30) Composition therapeutique selon Tune des revendications 21 ^ 25, 
caracterisee en ce qu'elle comporte k titre de principe actif un compose k activite anti- 
FMO. 

20 31) Composition selon la revendication 30, caracterisee en ce que le 

principe actif est un anticorps anti-FMO. 

32) Composition selon la revendication 30, caracterisee en ce que le 
principe actif est une sequence antisens qui bloque Texpression de FMO. 

33) Composition selon la revendication 30, caracterisee en ce que le 
23 principe actif est une sequence sens qui inhibe Texpression de FMO. 

34) Composition selon la revendication 23, caracterisee en ce que le 
principe actif est une sequence soluble interagissant avec FMO. 

35) Meihode de diagnostic d'une predisposition au glaucome, 
notamment k des affections de type GPAO, plus particuli^rement de type GPAO-J, ou 

30 des maladies liees k FMO chez un patient, caractdrisde en ce qu'on determine k partir 
d'un preievement biologique dudit patient la pr&ence d'une mutation dans le gfene FMO 
par I'analyse de tout ou partie d*une sequence nucieique correspondant audit g^ne, la 
presence d*au moins une telle mutation etant indicative d*une predisposition dudit patient 
k des affections GPAO ou des maladies lides k FMO. 

35 36) Methode de diagnostic selon la revendication 35, caracterisee en ce 

que la mutation que Ton cherche k determiner est la mutation G. 1263mac.A. 
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37) M^thode selon I'une des revendications 35 ou,36j.dans.JaqHellfc la, 
s6quence d'acide nucI6ique analyst est un ADN g6nomique. un ADNc ou un ARNm. 

38) Mithode selon Tune des revendications 35 k 37. caract6ris6e en ce 
que ladite analyse est i^alisde par hybridation. 

5 39) M^thode selon I'une des revendications 35 k 38, caractdris^e en ce 

que la presence d'une mutation est ddtectde par comparaison avec la sequence 
correspondante naturelle non mut^. 

40) Mdthode selon la revendication 39, caract^risde en ce que ladite 
hybridation est r^alisde k I'aide d'au moins une sonde oligonucltotidique sp€cifique de 

10 Talldle. 

41) MAhode scion Tune des revendications 35 k 40. caractdrisde en ce 
que ladite analyse est T&sdis^e par sdquen9age. 

42) Mdthode selon Tune des revendications 35 k 40. caract^ris^e en ce 
que ladite analyse est rgalis^ par migration 61ectro-phor6tique. et plus particuliferement 

15 par SSCP ou DGGE. 

43) M^thode selon Tune des revendications 35 k 40. caractdrisee en ce 
que ladite analyse est r£alis6e par une mdthodologie visant k ddtecter une tioncation de la 
protdine. 

44) Mdthode selon Tune des revendications 35 k 43. caractdrisde en ce 
20 que tout ou partie de la s^uence nuclfique du gfene FMO est amplifide pr&lablement k 

la raise en Evidence de la ou des mutations. 

45) Mdthode selon la revendication 44. caracterisde en ce que 
rampliflcation est realisde par PGR ou PCR-like. 

46) Mcthode selon Tune des revendications 44 ou 45. caract^risee en ce 
25 que les amorces choisies pour rdaliser Tamplification sont choisies parmi les amorces 

ddfinies selon la revendication 6. 

47) Rdactif pour ddtecier et/ou identifier une mutation du gfene FMO 
dans un dchantillon biologique. caractdris^ en ce qu'il comprend une sonde dite de 
capture et/ou une sonde dite de detection. I'une au moins de ces sondes comportant une 

30 s6quence selon I'une des revendications 1 k 8. 

48) Mcthode de diagnostic d'une predisposition au glaucome, 
notamment k des affections de type GPAO. plus particuliferement de type GPAO-J. ou 
des maladies li^es k FMO chez un patient, caractdrisde en ce qu'on determine k partir 
d'un pr^lfevement Wologique dudit patient la pr&ence d'un FMO mutd. 

49) Mdtiiode selon la revendication 48. caractdrisde en ce que la detection 
est effectufe par un proc&ld EUSA ou RIA. 
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... 50). M^thQde. .d&. diagnostic d*une pr£disppsilion£'auv.gJa]LLGpmc,. 
notamment ^ des affections de type GPAO, plus particuliferement dc type GPAO-J, ou 
des maladies lides & FMO chez un patient, caract^risde en ce qu'on determine k partir 
d'un prdlfevement biologique dudit patient Tactivitd enzymatique d'au moins une FMO. 

51) Application de cellules selon Tune des revendications 15 k 17 ou 
organisme les comportani pour la selection de produits impliques directement ou 
indirectement dans Tactivit^ FMO. 

52) Application de cellules selon Tune des revendications 15 k 17 ou 
organisme les comportant pour la selection de produits interagissant avec le J^O naturel 
ou mux6, notamment k titre d*agoniste ou d'antagoniste de cette enzyme. 

53) Produit obtenu par la mise en oeuvre de Tune des revendications 51 

ou52. 

54) Anticorps contre les protdines selon Tune des revendications 19 ou 

20. 

55) Anticorps polyclonaux ou monoclonaux, caracterises en ce qu'ils 
sont obtenus par reaction immunologique d'un organisme humain ou animal avec un 
agent immunogdne constitu6 par une prot^ine ou un polypeptide selon Tune des 
revendications 19 ou 20. 

56) Anticorps polyclonaux ou monoclonaux, caractdrisds en ce quMls 
sont obtenus par reaction immunologique d'un organisme humain ou animal k un agent 
immunogfene constitud par un polypeptide selon la revendication 20. 

57) Anticorps selon Tune des revendications 54 i 56, caracterise en ce 
quMl s*agit d'un anticorps marqud pour Timagerie. 

58) R&ictif pour la mise en oeuvre d'une mdthode de diagnostic selon la 
revendication 48, caractdrisd en ce qu'il comprend, k titre de substance rdactive, au 
moins un anticorps selon Tune des revendications 54 k 57. 

59) Utilisation d'un principe actif capable de moduler Tactivitd FMO 
pour r^aliser un medicament destine au traitement du glaucome, notamment des 
affections de type GPAO, plus particuliferement GPAO-J. 

60) Utilisation d'un principle actif capable de moduler Tactivitd FM02 
et/ou FMOx pour realiser un medicament destine au traitement du glaucome, notamment 
des affections de type GPAO. plus particuliferement GPAO-J. 

61) Utilisation d*un principe actif capable d'interagir avec FMO pour 
r^liser un medicament destind au traitement du glaucome, notamment des affections de 
type GPAO, plus particuliferement GPAO-J. 
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62X Utilisation d'un piincipe actif capable d*interagir ayje<;,EM02.,et/ou 
FMQx pour r^aliser un mddicament destine au traitement du glaucome, notamment des 
affections de type GPAO, plus particuliferement GPAO-J. 

63) Utilisation d'au moins un produit selon la revendication 53 pour 
reiser un medicament destine au traitement du glaucome, notamment des affections de 
type GPAO, plus particulidrement GPAO-J, 
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Figure 1 



EMQ2pFQj: 



CvsVal A<«Lt-»m i./ri -..-^1 .... 



_ ^ . 1 lav. 



60 
120 
180 
240 
300 
360 
420 
480 
S40 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1250 
1320 
1380 
1440 
1500 
1560 
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FM02prot 



CTTCTTGCTGTTGTTGTGCCC1TTTTTTCCCAAcI^?E«?^tcItAG 1608 



2 
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fragqifnt1.FM02 



CACAGAACTT ATGGAACTAT ATATNTNACA CAGCNAATGC AGATGCGTTC ATACAAAAAA 

^0 *0 50 60 

AAAATTGAGT CATAGGCCAG GGAAGAGAAA ACCAGTTTGG TTGTTATTTC TCTAAGGTAT 
*° 90 100 110 120 

AAGCCAACTT AATCAGAGAA CTTGTTGGTT TGTTATTTCT CTAAGGTC7A AGCCAACTTA 

ISO ijo 170 180 

ATGAGAGAAC TTGTTGGTTT CTTATTTCTC TAAGGTCTAA GCCAACTTAA TGAGAGAACT 

210 220 230 240 

TCTCCTCACA ACTCTCTGCT TCTCAAAAAG TACCATGTGG TTTTAAGGAC TTTTCTGTTG 

270 280 290 300 

AAATATGTAA CAGAAACTTA AAAATGAAGC AGCAGATACC AGGGCTCATA TCTATATTGT 
320 330 340 350 jjq 

TCTTATGATA ATATACACAA TTAAGCGAGC TTGGACTCAT CCAAGAATGC TTCAGGGCGG 

''O 400 410 420 

TGACTATGCG GCCCCTAACC ATGTAOAGGG CTGAAGGGGG CCAACACCCT CTTATTCTCC 

450 460 470 480 

TATACTAACC GCAGTATTTT CAAATCCAAA TACTTCTCAG CATTTTTATG CCTATCTTAA 
" 510 520 530 540 

AACTTTAATT GATGATAAGA TTTCACATCT CAGACCCTAG ACTCTTGCAG TTACTGACAT 

570 580 590 600 

TACTCCTCTT TCACATGCTG CCTGAATTCC TCTCTTATCC ACTAACAAGT GCTCATCTAA 
'^^ 620 630 640 6S0 660 

CCTTTGTTTG ATATTTACAC TGATAGGGAC TTCACTACTA TACAAAACAA CTCACTCTAT 
" »»W 690 700 710 720 

ATTTGTACAG CACGGTTGGC TAGAAAGTTC TTTCTCACAT TGAGACAAAC TCACTTTTTT 

'50 760. 770 780 

TGTATCATTA ACATATGTAA TCCTACAGAG ACTTCTTTCT ACCCAAAATA GGCTTGTATG 

810 820 830 840 

ACCTTTTCTG TATAGGAACC TTCTTGAAGG CAATTGTCAT GGATTTTTCA ATATCTCCTC 

TAGGCTAAGC ATCAGAAGTT TCTTCACTGG CCCCTTATGT GACATGCCTT TAAGAAGTTC 
'20 930 940 950 ggo 

ATTGCCATCT TGGTTATTCT TAAATTCTCT GCTACCTAAG CCAAGCTTAT TTCCACATGC 
»80 990 1000 1010 1020 

GTGAAAGATC OATGGGTGGT AAGGCCTATG OTCCTGAACT AGTAAATGAA TTAACATATG 

TGAAAGTATT TTTACAACTT AAAACACTTT GTAAACACAA GATACTATTA AAACATA^J 

CCTTCATAGA ACGCAACTTG GCAAAGCATA TTAGAAACTT GCAACTCAAA ATATGGTCTA 

AGGGTACACC TGGCATCACC TGGAAGCTTG CAAGAAACAA TTTCAGGCCC ACCTCATATC 
^^l- 1220 1230 1240 1250 1260 

CATT.^.CC CACCTGCATT TTGACAAGAT CTCCAAGTGT ^CATTTGCA CATTAAAGTC 
.OAGGAGC.C .CT...CTTA AAAA^ATGCA AACACTTTCA CTAAGCA^TC CT^TT^^A 
GGrATTTAJC CTGAGAA^T GAT.AGCTTA AGTACACAGC ATTTTTAT.. C.GC._^..r= 
7TACA...a... AGTTCCACTA ATAG,.A..ATT CGCCAAGGTG CTTTACGGTT C.TCA.GCA 
TACACCATTT GCCAGCCAAC GCTAACTCTA TAAAGCAAGC TCCTTCTTCT CAGCTGGTGC 
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^ ■ ^raqmentt.frM02 Pa,^^y 

c.c^.ccx .cc.TC«c. c;...c..rc 

^.c..c.c .c^^cc .„;..„cc cc.c.^.„ ..^ccxcc. oc..^„.. 

GCCATCrcCC TCCATCATCr TTTAAGCCTT CAGTC.CTTT AAAACTTTOC TTCTATACCT 

.CO..™ 

^c^^c ;^c.T^ 

TGTTAACAAA ATGTCTACCC AACTGCCAAT GAAGTGGCTT GATTTTTTTC TTTTTTTAAA 
.TTO^C^ ,.G.A.CC^ ,,„,^ 

C..ACCCAGG CTGCCGTACA AXGGCACAAT CA.ACCCCAC .GCAG.CJCC ACCXCCAOCC 
CC.CAAGCAA TCC^CCACC TCAGCCTTCC AACACCTCA CAC.ACAAG. GCA.GC.CCC 
ATGCCTCACT GATTTTTTGT TTTTTGCAGA GATGAAGTCT CACTATGTTC CCCAGTCTCA 
CC^GAACXC CTACCAA.AC CC.ACCC.GG CC.CCAAAC .GC ^A^J ACAGgJ^" 
GCCAC.G.GC CXGOCCT^ ^.^^ ^^^^ ^^^^ 

tac«:attga ,catc.«ttt rcTXArATCj <„.ag^„o .catagactt gctgcactta 

TTACACAGAG AACGCCTTTT ATCACGACCA A^AT^A GGAAATTTCA GGGAAA^CGT 

T^TCAGAA CACC„A„. CACA„A.AA AACAACXCJJ CA^ cTCCAgI^ 

CCCTTTCCAG TTTTCTTTTT CTCCATAGTC GTCATCACCA CO^TTTTAT TTTATTGATG 

CGCTGTCTGC CTCCC^AAC TGCAAAGTAA ACTCCACAAA CGCAGAGAGT TTTGTCTC^ 

TTAT^A^C CTC.ACCTCC ATCACTTAGA AAGTTTCTGG CACCTaZ GTGTTCAGTA 

AATA^AT. GAA.AAOTTT ATGTAAAACG TCTCAGACTC CTTAGAGAAA CTGG«:^ 

" 2680 2690 2700 

"'"^ ""■^■'^f, 

CT^XTJC™ „„^„. ^J^^ 

"~ — "ijc ™„ 

-<-=S *™"=jjc; ,.-c^c.c c„.c«„j a=c«^. 

'"""fffj °""°|fIS '='^'=?I=J «»CA=T.TC CTA«A=CC» 

2930 2990 3000 

GAAATCATCA AGTCTATGAA AACT^ :.GCr» r^-r^- n» 

3020 ''^'■"3i5s=~'^''^ss:r'"^iHfr^"='"?sfs 

..CATAATCT G.C^GTTCA ^CAGGCATG GT^.TCTGCC AGA...AG.G C.TA..C.CCA 

jIIO 3120 I 
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tragment1..FMQ2. 



^^^^^^ 

A^TCCTCC T.„«TJCJ <:«T.rTO« .,«T«^ CTT^^T CA^rrccAj 
»TT.=«r„ TCCA^CTC TTTO,=TCTJ TCT.IC™. ^TACTOCJ J^j 

— -«ccTj; =„ 

=c,„.jo„ c.™jc^ 

.TCTCTJJCT TT«0«TJT »T=TTOTJC T.T.TKJOT T^^TJJJJ 

K.TTOC.TJ .=T«TCTT= .CCTC.|«C ACCTOCCTCJ "CCT^W T.COAC^JT 

""""^ «™^;s '^-f-s — :=2c° ™J 

^TCcjccc «c«c«cj c„^c cx^jj cc^ec^c; c«^cjjc 

0«C«-JJC; ATKTOJCj; „.c.=CCJJ CC^^j^j 

--CCTcj; ^,=0^^ J 
^»T„ 0„„^„ ,„^j 

""°"SJ« cc^co™ o^^^ c„™55jc 

=««c»c; o«™=j ^^^^ 
Tccr^jj^j ^.^jjc; .„„c.sja c.oxcjjj; c=.r^„ 

JfS ™c»J« c^ro^ .0^^ 

^w^u <060 4070 4080 

TGTOATJCCA CCTGCCaTCA OTOGCCT^. TTCTCTGAAO TOCTGTGTCG .^AOGGACT 

TGAGCCCACT TGCTTTCAOA C^AACT^AAGA TATTGGACGA GTGTGgIgIt TCAAAGT^" 

4180 4190 4200 

TCAGATTTTC TTCCCTCTTG A..CAGGJTGT CTTGTTATTT CACCGTGAAT CACAGTTACT 

CATGGGTCAT ATTCAGAAAT TTATTAAACA ACTCTCATCA GATTTTATTT CTATTTATTG 

..C.GOCCAX AATCCAACTG AAC.CA.AGC CTGGCA.C.C AA.A ^CC 

AGCrCACCCA GGCA.C... ACA.C..C ^GA^C AG^ 

TTACAGCCCA TACTTCTGTC ATTCTTTAAT ACGCTAATAT TAGAGAACAT TTTAC..=^ 

^-80 4490 4500 

7AG^.^G?AA.C -GGGA7TCT? CTCA^.GATAT CACTTCTGTT TCK^I 
^slO 4520 4530 



rATTA AACCAAA7GC 
4550 4560 



-Cr-AGAC- ACCATC-C7CT ^ATCATTACT ATTTTTCTCT GACAAATGAA GCATGTTTGT 

4390 <600 4610 i^20 
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fragment1.FMQ2.. 



TTTTATTAAA 
4690 

AGTCCATTCT 
4750 

GTTTAATTGA 
4810 

ACTGGGAAAG 
4870 

ATTAGAACGC 
4930 

ACCTACCCCC 
4990 



TTTATTCTAT 
4700 

CATGCTGCTA 
4760 

CTCCCAGTTC 
4820 

AGAGGTGCTG 
4880 

ACTCACTATC 
4940 



TAATCAAACC 
4710 

TGAAGAAATA 
4770 

CACAATCCTG 
4830 

AGCAAAGGGG 
4890 

ATGAGAACAG 
4950 



AAAATATTGA 
4720 

CTGAGACTGG 
4780 

GGGAGGACTC 
4840 

GAAAAGCCCC 
4900 

CATGACGCTA 
4960 



ACCAGGTCCT 
5000 



TAATGCTATT 
4730 

CTGATTTATA 
4790 

AGGAAATTTA 
4850 

TTATAAAACC 
4910 

GCTCCCCCCT 
4970 



TGAGATTTGG 
5050 

ACTTAGAAAG 
5110 

AATAGGTAGT 
5170 

TGTTTCAATT 
5230 

TGCTATTTTG 
5290 

ATAGAGTTCA 
5350 



ATGGGGACAC 
5060 

TTGCATAGAT 

5120 

AGCTTACCAC 
5180 

TACTCAGTTA 
5240 

AAGATTAAGG 
5300 



TCCCAAGACA 
5010 

AAAGCTAAAC 
5070 

AGCTATAAGG 
5130 

CTTCTACCTG 
5190 

TAAATGGATA 
5250 



TCTCTGTATT 
4740 

AAGGAAAGAG 
4800 

CAATCATCGC 
4860 

ATCACATCTC 
4920 

TGATTCAATT 
4980 



TGTGGGGATT 
5020 

CATGTCACTG 
5080 

AGTTACAATT 
5140 

TCAGATCTTG 
5200 

TAATAACAGG 
5260 



GTGCGAACTA 
5030 

TCCTTAAAAA 
5090 

ATTCCTTCCC 
5150 

AGCAAGTTAT 
5210 

AAAGTGTGAT 
5270 



CAAAGTGAGG 
5410 

AACCACGGCC 
5470 

GCATTCTTGC 
5530 

TAGAATTATG 
5590 

AGCAAAAGGT 
5650 

CTCACTGCAG 
5710 



ATAAATGTTA 
5360 

CAGCTTAACT 
5420 

TACGTGACTT 
5480 

TCAAAAAGAT 
5540 

TAATCAGGTA 
5600 

TTCAATACAT 
5660 

GCTGACTAGT 
5720 



CAGATAATTC 
5310 

GCTACTAATA 
5370 

GAGATGGCCA 
5430 

CTAAACAGAT 
5490 

TAAACAAAAG 
5550 

TCCCTCAGAT 
5610 



ATATAAAGAA 
5320 

ATAACTATAT 
5380 

CGGCCACACA 
5440 

AACCCCTGAC 
5500 

TTTAAGTTCA 
5560 

ATTAAAACAC 
5620 



CTTAGATAAG 
5330 

ATTTTATACA 
5390 

ACTGGAGGAA 
5450 

TTACAACCAT 

5510 



GTCAGTTCAA 
5770 

CTCACCTACA 
5830 

TTTTCTGAGA 
5890 

CTTAAAGATA 
5950 



GAAAATCAAA 
5670 

TAGGAGGATG 
5730 



ATTGAATCTC 
5780 

CATGACCATA 
5840 

CAGGGTCCTA 
5900 

C7GATTCCTT 
5960 



ATGCCAACAG 
5790 

AACCACACCT 
5850 

CTCTCTCACC 
5910 

TGGTTAAACC 
5970 



CTCATATCAG 
5680 

GCAAGGTGAT 
5740 

CGATCTTTTT 
5800 

GGAGGGTTTC 
5860 

CAGGCTACCA 
5920 

TGCCACCAAI^ 
5980 



GAACCCAAAA 
5570 

ATAAGAATAT 
5630 

CAGAGACCAT 
5690 

CCAGGACCTG 
5750 

TAACATGTAA 
5610 

TTTTATTTTC 
5870 

TGCCCAGCCA 
5930 

.-AAAA.iA 



CAATTCAATA 
5040 

TTTCTATAAA 
51O0 

ACAACCTCTC 
5160 

TTACATCCTG 
5220 

7ATCTCATAG 
5280 

TTCCGGACTC 
5340 

TCAGCAAACT 
5400 

CTGGCCTTCA 
5460 

GCCCTAACTT 
5520 

GCAATGACTT 
5580 

TCCAAATGGG 
5640 



A7AAAGGGCT 
5700 

CGCATGCTTT 
5760 

CATTAGGTGT 
5820 

TT7TTAATAT 
5880 

TGGAGAGTTT 
5940 
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Figure 2 (suite) 



ACAAAGACTG GCATTAAATA GGTAGAGACC TAGCATGCTA ATATCTTGCA ATGTGCCAAA 
10 20 30 <0 50 60 

ATAATTCTCC CTGTCCCCAA CCTCACCATT GCCAATATTA CCCCTACCCC TCACAGTGAC 
70 BO 90 100 110 120 

CGTCACAGGC AGGCAACAAA CTGGTGTCGT CACAGA.'VTCA TTGATGG.AAC ACATAGACTG 
i30 140 150 160 170 180 

CATTCATTAC CTAAACATTG TCGTCACACT GCAGCAACCA AAGACAATCG CATTACCCAG 
i90 200 210 220 230 240 

GGGTTAGATG TAGCAAGAGT AAAAAACAAA AAATTTTTGA ATGCGTAATT ATCACTAATT 
250 260 270 280 290 300 

ATTTTATTTG ATCCTTCAGG AGAATGTCGA AGATGGCCGA GCAAGTATCT ATCAATCTGT 
310 320 330 340 350 360 

CGTTACCAAC ACCAGCAAAG AAATGTCCTG TTTCAGTGAC TTTCCAATGC CTGAAGATTT 
370 380 390 400 410 420 

TCCAAACTTC CTGCATAATT CTAAACTTCT GGAATATTTC AGGATTTTTG CTAAAAAATT 
430 440 450 460 470 480 

TGATCTGCTA AAATATATTC AGTTCCAGGT ATTGTATTTT TGCGGAAATG GGTTTCTCTG 
450 500 510 520 530 540 

CATTAGTTCA GCTCATATTT AGATAGAAAA GTTACTCTGA TAATGAAAGC AATTATGAAT 
550 560 570 580 590 600 

GAAGTATCCC ATTCTAAGTA TTTGTTGAAA TATAACAGCC TCATATAAAA CCCAAAAAGT 
610 620 630 640 650 660 

AGTGTCATTA CCCTTGGTAT TATAGATTAT ATACATTAAT TGAAGAGGAA AATCATCTGT 
670 680 690 700 710 720 

TAAAATTAAA GGTTTGAATA ATAATATATT GATGTCAAAA CTTTT 
730 740 750 760 
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fragfnent3.FlV102 



ccccgagaca 
10 

actgcaacct 
70 

ggattacagg 

130 

ctcaccacct 
190 

ccccccaaag 
250 

aaaccaatac 
310 

caaaattaaa 

370 



gagtctcacc 
20 

ccgcctccca 
80 

cacacatcac 

140 

gggccaggcc 
200 

tgctgggatt 
260 

ccgccatcac 
320 

ttgctgtttt 
380 



ctgttgctca 
30 

ggctcaagtg 
90 

catgcctggt 
150 

ggtcccgaac 
210 

acaggtgcga 
270 

tgaacacacc 

330 

gtttccttag 
390 



99Ctggagcg 
40 

attctcctgc 
100 

tcatctatgt 
160 

tcctgacctc 
220 

accaccacac 
280 

cage c tea tt 
340 



cagtggcatg 
50 

ctcggcctcc 

110 

attcttggta 
170 

aagtgatcca 
230 

ccagcctcaa 
290 

tgcctcgaaa 
350 



cttcttcata 
400 



tgcac&aaat 
430 

atcatttttt 
490 

cacctggaat 
550 

agcatgccga 
610 

caaaatataa 
670 

ttgggaggct 
730 

acagcgaaaa 

790 



aaattcattg 
440 

tctgaatgca 
500 

taccttttcc 
560 

atctttatca 
620 

atcacatttc 
680 

gaggcaggaa 
740 

tctgtctcta 
800 



gtctctgttc 
450 

acctcttaca 
510 

tgtgctccct 
570 

atggtctata 
630 

ttggccaggt 
690 

gaccacttga 
750 



atac tagaag 
460 

acctaaagat 
520 

caaaatcaac 
580 

ctctgagaaa 
64 0 

atggtgactc 
700 

acccaagagt 
760 



gaaacgggat 
410 

gctgcgggaa 
4 70 

ggccagacca 
530 

aaaaagcaat 
590 



atctcagctc 
60 

agagcagctg 
120 

gggacgaggt 
180 

cccgcctcgg 
240 

aaattcactt 

300 

gggcgtatac 
360 

ctcctagacg 
420 

gtattcgctt 
480 

ttttgaaaaa 
540 

attttaacca 
600 



tagctactac 
650 



atgttcgtaa 
710 



ctgagaccaa 
770 



caaaaaattt 
810 



acccgtggtc 
850 

agccgcaata 
910 

gtctcaaagc 
970 

cacatgtcat 
1030 

aaattttggt 
1090 

agtttttcac 
1150 

gtcttgtsac 
1210 

atararaacc 
1270 



ccagctattc 
860 

agcggtgatc 
920 

aaataactaa 
980 

tttcttagta 
1040 

gaaaatctgt 
1100 

caattcctgg 
1160 

tttgtgcact 
1220 

tctattccat 
1280 



tagactgaga 
870 

gtgccaccgc 
930 

catttctgga 
990 

actCLaacac 
1050 

atttataaat 
1110 

tagatctaac 
1170 

taactatcaa 
1230 



ttaaaagact 
820 

agggaggatc 
880 

actccagcct 
940 

caaacaactg 
1000 

taggcttata 
1060 

tccattaaaa 
1120 

ttgtgaataa 
- 1180 



acccaggcac 
830 

gcttgagcct 
890 

gggcaacagc 
950 

ttagtgaggc 
1010 

taatatcaac 
1070 

tgcccagttc 
1130 



cagattacgt 
1190 



tctacttaac 
1240 



ccctttaaag 
1290 



1330 

aaggtttctg 
1390 

agaagcaccc 
1450 

tgcccctcaa 
1510 



tgcgttactg 
1340 

tttattggtc 
1400 

aaacigtaac 
1460 

act ttaatgt 
1520 



ccacttttgt 
1350 

tcLgagttgg 
1410 

aagccccgtt: 
1470 

ggacat^aan 
1530 



atcatgctag 
1300 

ccctcggaga 
1360 

tgtaagtcat 
1420 

gcttatgatt 
1480 

cacctggata 
1540 



aaacatattg 
1250 

agtcgcaagg 
1310 

gtgaagaggg 
1370 

aggtgccaga 
1430 

gicaatgtaa 
1490 

tcttgttaea 
1550 



gcttagaaaa 
£60 

tcccagcact 
720 

cctgggcaat 
780 

gctgacaccc 
840 

gggaggccaa 
900 

gtgagacccL 
960 

ttatttttaa 
1020 

ttacaatagt 
1080 

tacctaatgc 
1140 

ataccagaag 
1200 

cctttttatg 
1260 



aagtcatttc 
1320 

gtitgg-aaga 
1330 

gcccaacccg 
1440 

cctacatcag 
1500 

aaig::a5gtt 
1560 
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fragrnei:it3.lfM02.« 



ccaattteac aggtatgggg taagttctga aattccgcat ttctgacaag cttccaagtg 
1570 1580 1590 1600 16X0 1620 

atacLgaaga ^cctgatcct caaatcacat tctgaacagc aaggatctac agcacccagt 
1^40 1650 1660 1670 1680 

taatatacca cctcgaacta ccatctgaaa tcttttcttt cacctgaaaa ctgcccagat 
1690 1700 1710 1720 1730 1740 

acccaaagcc cttccacaag atttctacta atactccata tacattttta aattgagaca 
^^^^ 1760 1770 1780 1790 18O0 

gcttaaaaac taccaaccca gcagttggaa aaatatctga aaatttgaga tatataaaag 
1810 1820 1830 1840 1850 I860 

actaaaatac ttgcaaatga gaagcatgcc attcctctag caeca taaac tttgctccca 
1870 1880 1890 1900 1910 1920 

cttgacatcg tttcttaatc cagcagatat gaaacactta tgcacaactt taaaaattaa 
1930 1940 1950 I960 1970 1980 

cagacctcca 9tgagctaca tttaaaaaaa tcaatgaacc aataaatcat cctattcaaa 
1990 2000 20X0 2020 2030 2040 

taagatcatg "ctgtcttg ctcacatgac gtactctgtt ttaaaaatag caaatgtcaa 
2050 2060 2070 2080 2090 2100 

aaactatcat tcagtggaat gctgaccatg tgtcaggcac tctgcaaagc gccttgcgtg 
2110 2120 2130 2140 2150 2160 

aaatatcttc tctaatacaa agtccacaaa gaggcggcta cataaaacgc tcctgacaca 
2170 2180 2X90 2200 2210 2220 

tgccaattgc atgatcactt gaattattgg tttgttccct tgtccagact atcaaataac 
2230 2240 2250 2260 2270 2280 

aaacagagag aagttcttta aaagaaaaga tatatatttg gcgatagagc attgtaatga 
2290 2300 2310 2320 2330 2340 

gaatgcacat gccatggtaa actattcgtg tattcaggga gttaaaggaa gacaaaggtt 
^^^^ 2360 2370 2380 2390 2400 

tctaaatggg gaaaaaacac aattacataa Ltgttttgaa ataattatat aaagagcaat 
2*^° 2420 2430 2440 2450 2460 

aacaagggtg ^tgccagtcc 9agatcggac agttactgag cagatgttcc tgtagaagcc 
2470 2480 2490 2500 2510 2520 

actttcgtgt aagatcatga C99tctttgt gtaaggtggt ggcctttgta gtctttgtca 
2530 2540 2550 2560 2S70 2580 

tcaggcacac atcacgagaa cccgctcttt ctggcctttc ccaactctac ttgtcgggtt 
2590 2600 2610 2620 2630 2640 

tctcaacatc ^^tgactcca tctagattct ^acagttctc atgagaactt gcttttcttt 
^650 2660 2670 2680 2690 2700 

tccccctcaa ^tccttattc ^^tattcagc acccttaaca gattag.ccc accgctgag. 

^^^^ 2720 2730 2740 2750 2760 

caggcctctc ^catgaagca 9caatgagaa agacacactt ggccaatgtc atcctggag. 

2'79 2780 2790 2300 2810 2820 

aac.c.caa. sa^gccttct ccg-.gtrrcc tcaagacaac Lgtccttag. gtgagaaaa: 
2530 2840 2850 2360 2870 2880 

^^"""^f::^ '^""S^nn "<=caa£gga aggctgtcac tcagagcaac ggcaaggagc 
2==-° 2900 2910 2920 2930 294C 

agagcgctgt cttcgacgca grtatggttt gcagtggcca ccacattcra cctcacaccc 
^^^^ 2960 2970 2930 2990 3000 

cactgaagzc artticcaggj gagacccgc-. gggartccca gctttccgca gcaggcitcc 
3020 3030 3040 3050 3060 

aggtactt^a latgragirt ggatcgacaa gcaggattca ttgccgcaac cgggcagaac 
-^^^ 30cO 3090 3100 3110 3120 
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z — : ^-.^ fi:agment3.^MQ2 . . • 

— — 3^?|§ -caccaajca .ca.cccc^c 

""""'S -""!tr§ —3^1? — c«,,aa^cc 

accaa,.ccc .,,cacaac. „a,a,aac. cacaccaaac c„ccc.cc, J^" 

J^BO 3290 3300 

"""SIS '""-ss """fijs 
""";5;s ••""siss """i;;; '""nm ~" 

—fJIS Jjjs 

«.=«.„5 ,„„ 

"''^ J5J0 3540 

""'""I — -'""fl^S --'113^0 .aaa,cc«, a.„c«„a 

j:>bo 3590 3600 

.accacccc caaa,a«c. .aca«ac,g .,ca„,..a ,a,caa.,aa a„«,c.ca 

3650 3660 

.......... a.a.aca..c a„a»aa„ c„,«ca.c .a,a,caacc ,cc«caaac 

■"*^u 3710 3720 

-,.,.cac« ,,a,„ccc. c,aaa,caca aa«,cea„ ccccaccccc cacaccccc, 

acccaaca„ .,ccat„ct .,...„c« ,.cc.aa.« cacacc,a,a ccaaccZ 

— — 3^5? ----IS .-.ca,.aa, a.ccc^^ 
-aa,aa.„ a..aa,c=a. ^^^^^^^^^^ 

-^^^w 39»0 3960 

«010 4020 

""";§fs "--ij 

4070 40S0 

..«..;,cj 

"""j;;; «;« ".c.,„„ „„„."" 

«ieo <i9o 4200 

.=aata,aa, acaaac.aa, a=a,ca,ccc t„cac,,„ cc,a,aacc. ,cac..ccaa 

4250 4260 

cacc.,,c.a .,cc,a.ac. ,c.,,cca., .,«cacac. cc,a,aacca a.aa.ccaaa 

'"""330 — "--5- caaacac... acaaa.cca. ..^..^ 

'iJ&O ^270 43B0 

'"'"'"K ""'"-ss '"-nfs — .---j;. 

«-° 

^-SO 4490 4500 

cac=tcc|,a aaacaa.a.j .ccaaacc,. a«ctaac=a ...acac.a« 

'=-0 -CSsO <560 

a.aa:sa:a; cacttcacaa tccoc--«ac 

.530 ------I -..a-.c.,a .ea,.„.c. 



46S0 
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tragment3.,eft/l0.2> . ^ ' 



'^^^^T.n — 

= .cc=.a,« ,c.,„a.a caa,.,cac, accacccc.g ,caccc;.a, 
«ca.cac,. c„cca„c. „..=aaa. ccc.^.cccc a,.,a.cc. 

ccc,cc..„ ccccccaaa, .,«„,a« a„„.,.,a ,ccaccacac ccc,cc.aa. 

aaa„,.eaa a.,ccaccac a.a,cccaa, a..,.aca.a a.a„ca„c 

.CC,ca,cc, .aa,cc,ca, cccc.,aaa. aaaaaa.caa ccc«.„. cc.,c..c« 
C,CCt,..c. «,....,cc ,aca„«ca cccc,.=acc ca,a«„a, 

C,ca,.,acc caa.ca„„ .cacc,caet cct.acc.cc ca.,«caa, caa.cc.ccc 
-c«ca,.ca ccc,a,ta,c t,„accaca ,.ca.,caca acca.,ccca ,ccaac.cc. 

'^-"ng? '""*f5?5 cc„.cccaa accc«,„c 

.caaccaacc c,ccta„cc tccc.aa,c, c.,„a«ac a„cccc.cc c„ccc„ca 
cccaaa«« «.a.,.,cc cta«c«ac a,a,aa,a„ caaaacaa.. accaac.cca 
,-aa„aaaa ,c.,.caa., ca^.c.cac. ,aaa.a,cc .,acaca,c. ,«cc„a,c 
.caca,acc. cccc=.,aa, ,cac„a,a, ,cccaaa„c caa.ac..cc 

.aca,=c,cca a.acaa,=a. cca,a.,,a. cc,a,„aaa ac,ca.ccc. ,.,a.c.,aa 

-'"Ills —II- -«,c.,c. ca„..c,a. 

.=tc.c.,cc .acca..cac cc„a„„a „aa,c„„ a.^cca.acc „a,aacccc 
-,=caca.aa cc,c„„cc aa.cc.cacc aacca,.„ 

ca.a,aaaa. «„aa,.ca a,aaa.cac. „.c«c«a ,cc«..ca= .acca,cca 

— fs-S — —It- -"-a-, "ccccca;. ...aaaa.„ 
,.acc.-...a c=a,a..ac. .cccaca.aa ,a„ccc..c a.ca.ca-.„ 



rgcag 
6000 



"""His """isi; --"-i — 

'-""|;s; "-"i?- 

c..„..„„ 

"'"" SS '""-Hts "--"iK; 
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fragment3.FM02 



6250 
6310 

6370 

ct^ag^cctt 
6<30 

ccaaagaytc 
6490 

aaaaccaaac 

6550 



^t^a^nna^g 
6260 

ttgaattata 
6320 

-aaatagaca 
6380 

ctaaccactg 
6440 

aaacattcat 
6500 



Page^ 



:ncaatct5t 
6270 

tttqaaatat 
6330 

9"a95tctct 
6390 

tctcccttgc 
6450 

tacacgatya 
6510 



tcacactctg 
6260 

agataacctt 
6340 

caactaaaa^ 
6400 

acctgctcag 
6460 

t9Ctgct5ac 
6520 



tccttctgca 
6560 



^agggtggct 

62S0 

cagttaccca 
6350 

cacagatatt 
6410 

gaatgacacc 
6^70 

agtggtggcc 
6S30 



ccttcccaaa 
6610 

agctctttca 
6670 

acaaaccatt 
6730 

tcacaagcaa 
6790 

agagtca tec 

6850 



gtattccccc 
6620 

gcccgatgtc 
6680 

tccatcctaa 
6740 

acatgacacc 
6800 

atcagtcagt 
6860 



aggacagacc 

6570 

tcaagaaggc 
6630 

tctggccacc 
6690 

gccttacact 
6750 

cgcccagcag 
6810 



twtagaaat t 
6300 

aacac targa 
6360 

taggtgcttc 
6420 

agccgagctg 
6480 

aggaatagca 
6540 



taggcaaaga 
6580 

ctgaaccaga 
6640 

cagggcttac 
6700 

tccaggactc 
6760 

gttaatgaag 
6820 



cggaaagaga 
6910 

ttatcacctc 
6970 

cagagctgga 
7030 

ccctaggaac 
7090 



cttactagac 
6920 

agtgtgaaga 
6980 

aaa tgagagc 
7040 

fi^agtgtaat 
7100 



gaagatccac 
7150 

actccaaaga 

7210 

caggaagact 
7270 

cttacagctt 
7330 

ctatcagtgt 
7390 

tcatctttaa 
7450 



tagtcagtgc 
6870 

ccaataagcc 
6930 

acaagcgagg 
6990 

accagetcta 
7050 

ygggcagtat 
7110 



cagcccggga 
6860 

ttcactttgt 
6940 

aggcaggaac 
7000 

ggctctctca 
7060 

gtgaggagcc 
7120 



agggaaaatc 
6590 

tgcccaacca 
6650 

catggccctg 
6710 

tagataccca 
6770 

9ggtta&act 
6830 

acagagcagg 
6690 



accaaacatc 
6600 

cccctaqcct 
6660 

tgcacaacca 
6720 

gcggcaaaag 

6780 

gggacctgtc 
6840 

tcactaacac 
6900 



cccagac&ac 
7160 

catcaaatct 
7220 

^acggtgtga 
7280 

ctcaaacaat 
7340 

aaatgccacc 
7400 



gaaaataaac 
6950 

tgtgacagcc 

7010 

cgctacgaat 
7070 

aatatagcag 

7130 



ctcacgttgc 
7170 

tagatggcaa 
7230 

gattcaatat 
7290 

cttttgcaca 
7350 

agatgccccc 
7410 



cagaccagtg 
7180 

gaaccagttc 
7240 

taagaaacca 
7300 

9agcgcaaaa 
7360 

ttcttaggag 
7420 



atttggactt 
7190 



aacagagccc 
7460 



ctLgtatggg 
7250 

ccttggctct 
7310 

gactttgttt 
7370 

gtacttcact 
7430 



ctcttgtcac 
6960 

tggagaagag 
7020 

acccgcaaag 
7080 

ccagccaagt 
7140 

agatctcttc 
7200 

tctcgcccta 
7260 

ac&tgcatgc 
7320 

ccatctccct 
7380 



•aatagaLtc 

7510 

-ctgcacraa 
7570 



acaggaccte 
7c90 

ctgaactcac 
7750 



cccciaaaia 
7520 

-cicttcaac 
75£0 

cagaccaaca 
7540 

-acatgctag 
7700 

caaaattcig 
7760 



cagtaaattc 

7470 

taatgrcata 
7530 

actta-rega 
7590 



tggggctatg 
7480 



catgcgatac 
7490 



ttgaggtcaa 
7440 

atcacctaca 
7500 



caac^gaaci 
7710 

a^-gtgcact 
7770 




a:ca:aeatt 
7540 

9iaacaacar 
7600 



tccaggaica 
7550 

aaatctataa 
7610 



::ctgtga 
7660 

2;gcgcatct 
7720 
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fragmi^nt3,FM.02 ^ Bage>6.r. 



gctacagcac cccccaccac aatccaaaag caccactcaa gaccacavog gaccgtgctQ 
7810 7820 7830 7640 7850 7S60 

catcaccgta ttagtccatt ctcaacgctg ctatgtagac atacccgaga ccgggtaact 
7870 7880 7890 7900 7910 7920 

cataaagaaa agaggtccaa tcgacctaca gtctggcatg gctggggaag cctcagoaaa 
7930 7940 7950 7960 7970 7980 

ctaacaatca tgacggaacg cacctcttta cgaggctgca ggagaaagaa tgagagcgac 
7990 8000 8010 8020 8030 8040 

tggggaaccc cctataaaac catcagatct cgtgagaact tactccccac caggagaaca 
8050 8060 8070 8080 8090 8100 

gcatggcaga aacctccccc atgattgaat tatctccacc cggtcctgcc cttgacacgt 
8110 8120 8130 8140 8150 8160 

ggggattact ataattcaag gcgagatgtg ggtagggaca cacagccaaa ccatattagt 
8170 8180 8190 8200 8210 8220 

catttacata cttctgacca aaaaccaaac ctctggcctt tgacctaaaa catgcgtctc 
8230 8240 8250 8260 8270 8280 

agagaaagca gcctgagcct aaatcctcat gtttctctca ctgttgcagc tagtgtcatc 
8290 8300 8310 8320 8330 8340 

aaggcaggtc agaccacccc gctgcaggga gggtcacaac agaaaaagag tgaatcaaac 
8350 8360 8370 8380 8390 8^00 

gggcagagca taccatttga aacatggttt gctcctgaga aagaagaggg gacagtaagt 
8410 8420 8430 8440 8450 8460 

aatggaaaga gacactaatg aaaatatttt tgtatctaat acctaaccaa agtattgcca 
8470 8480 8490 8500 8510 8520 

agtcagccta taagggcaac ggcaggagaa attcagaaca taggcatata ccacacacao 
8530 8540 8550 8560 8570 8580 

accagcaata taggaatgcc tggcataggt gctacttcac aagctaggaa tccaaggccc 
8590 8600 8610 8620 8630 8640 

atccccacaa aattcgtctc caaatcctgg tctactccag acacaaggca ctgtatgaaa 
8650 8660 8670 8680 8690 8700 

ctcctctctc ccagcctaac tttataactt aacagctagc agcacttatc acttgccaco 
8710 8720 8730 8740 8750 8760 

caacatttca agtactttat atacaccacc tcatttaatc cacacaagaa tgccatcaco 
8770 8780 8790 8800 8810 8820 

taggtactgt caataccccc attttacaga gagagaaact gaggcacaga gagattgaaa 
8830 8840 8850 8860 8870 8880 

taactcaacc atggcaacac agattgaaat agttcaccca cagtagtgtg atcgggattc 
8890 8900 8910 8920 8930 8940 

aaacccaagc agtctgtatc caaacctctc aagtaaattg gttaccrtcc aagtcaatct 
8950 8960 8970 8980 8990 9000 

tatgcgttta ccaagtatag ccttaaacaa aaacttattg catggcatct aaaaatriaa 
5010 9020 9030 9040 9050 9060 

gaagcactcc aagtatgcat ^tggccaatg ggggagcaac agcaaacaca gcaaaataca 
5070 9080 9090 9100 9110 9120 

catvtgaaaa gagactaaei gtacatctcg gaaacaaggg aaaicicaai aaacaaccta 
9130 9140 9150 9160 917C 9180 

aagaatacac ctgaaagagg aticagatgt gcacttgaag agaaagagaa rcacagtaca 
9200 9210 9220 9230 9240 

agttcagagw t^ct&acrtc caaaatacac tacaagcaci gr.gtcrcat.g cctgtaarcc 
9250 9260 9270 9230 9290 9200 

cagcaccctg ggaggctgcg gcaggaggar tgcttaagcc cagaaattcg agaccgacct 
9310 9320 9330 5340 9350 9360 
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jragnienta.FMOa 



gggcaacata 
9370 

acacgcccga 
9430 

ccatgactgc 
9490 

cacacacaca 
9550 

ttatttcccc 
9610 



acgagaccgc 
9380 

taccgaggcg 
9440 

acaaccgcag 
9500 

cacacacaca 
9560 

tgttattccc 
9620 



ccccacaaaa 
9390 

ggaggaccac 
9450 

tccagcctga 
9510 

cacacacaca 
9570 

catccaggga 
9630 



tagccaccag 
9670 

aagaaactta 
9730 

cagcaaacca 
9790 

aaagacttcc 
9850 

cgcaaatgcc 
9910 



aaattgtttg 
9400 

Ctgagcctgg 
9460 

gtgacagagc 
9520 

aaacaaagtc 
9580 

tattcagatg 
9640 



gctataatcg 
9660 

ggtgagtgga 
9740 

caactgcaaa 
9800 

tcgtgtctcc 
9860 

actgggtacc 
9920 



aattagccgg 
9410 

gaggtcgaga 
94 70 

aagaccctgt 
9530 

ttctaagtac 
9590 

catatacact 
9650 



cacatttcca 
9690 

aaacatgaga 

9750 

catgggaaag 
9810 

acgaagttct 
9870 

cctatttagg 
9930 



aaaacagaac 

9970 

tccccctaaa 
X0030 

tatcagcacc 
10090 

ggactcagtg 
10150 

tgtaaaatgg 
10210 



aggattataa 
9700 

ggagggaggg 
9760 

acttgtggat 
9820 

caagattttg 
9880 

aggtacttta 
9940 



tcattctacc 
9710 

aggaactttc 
9770 

tctatcacca 
9830 

ttgcagtctc 
9690 



atgtggtggt 
9420 

ctgcaacgag 
9460 

ctcacacaca 
9540 

ggaaggaaga 
9600 

tacacttgtg 
9660 

cgcactatag 
9720 

tcttaaggag 
9780 

gagtcagccc 
9840 

cctgcatcag 
9900 



ctccgtaaat 
9980 

cgggacaatg 
10040 

aggcatggca 
10100 

ttccacaccc 
10160 

atgatagaac 
10220 



cactgaggtc 
9950 



tgagcctcaa 
10270 

agctgtccga 
10330 

acaatctaac 
10390 

acccctttaa 
104 50 

aaaactaggg 
10510 

agagattacg 
10570 

aac tcacgcc 
10£30 



tctggggcta 
9990 

ccctaattta 
lOOSO 

cctgggtcat 
10110 

ggtttcgttc 
10170 

aacagatgaa 
10230 



aacaagtaga 
10280 

aggtgtctcc 
10340 

aatatgagta 
10400 

aaaatacgca 
10460 

gagaactttc 
10S20 



gctattttgc 
10290 

cttaacaaag 
10350 

tcttataggt 
10410 

agaagatgaa 
10470 

taatacccag 
10530 



cacatgtgat 
10000 

aactgcactt 
10060 

gagccgtatc 
10120 

tatgctccgc 
10180 

Ccggtggttc 
10240 

t:ctttcaacg 
10300 

actcaaattg 
10360 



acatgacctt 
10010 

etttttgctt 
10070 

tccgaagacg 
10130 

aatgtactgc 
10190 

aaccatgaaa 
10250 

gtatactcgt 
10310 



ccaacacggc 

10370 



acctgccttt 
10580 

tcgctaaccc 
10640 



acacwccttt 
10690 

gatttaagca 
10750 

cccctaaaaa 
10310 

-ntiO»-Ha5a 

' roa7o 



ctcttcgcca 
10700 

caagcaaatg 
10760 

aacageagag 
10820 

^ctgacataa 
10860 



cagaggggtg 
10590 

tatagcatga 
10650 

aaagacaaac 
10710 

ttatgaatgg 
10770 

ctrtagaatc 
10630 

gtgccacgta 
10890 



cctggagttt 
10420 

gcagaagtgt 
10480 

agttatctaa 
10540 

tggtgggaaa 
10600 

aggttctccc 
10660 



agcttctaaa 
1O430 



aatcatcttc 
9960 

cacagcagac 
10020 

gccaggtttt 
10080 

9ccatccttg 
10140 

cacgaacagc 
10200 

attacggcct 
10260 

cggtgagcaa 
10320 

agtcaaaact 
10380 

ttcggaccga 
10440 



tataagccgc 
10490 

cattggagaa 
10550 



catgtaatic 
1O610 

catgggaaac 
10670 



ccccgtcgan 
10720 

ttcttctgct 
10780 

ttrtaacaaa 
10840 

tcgtccatta 
10900 



cgtcaaagti 
10730 

ttagtrgtta 
10790 

tgcctgccgc 
10850 

aaaaaag&aa 
10910 



tccagaaagc 
10500 

aactgtttca 
10560 

tccatctaac 
10620 

ctrcgaaaac 
10680 

a-atgrcagL 
10740 

caggcctctt 
10800 

gcaaccacca 
10860 

aagaaaatgt 
10920 
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iragmept3^EM02 



tctcaaatct 
10930 

agactccatg 
10990 

tcacattgat 
11050 

atcaaacagg 
11110 

aaaaacagaa 
11170 



acaaaaaaaa 
10940 

gacatttggg 
11000 

cccttcacag 
11060 

ggttaaacaa 
11120 

atggtataac 
11180 



taagcggacc 
10950 

attaacaaac 
11010 

atctcaaaac 
11070 

aacagcaaaa 
11130 

aaccaccaca 
11190 



ttttgtctaa 
11230 

catgttttcc 
11290 

aaggatttgc 
11350 

actCLcagag 
11410 

cccagaatgt 
11470 

cgatgcccca 
11S30 

cacagaaact 

11590 



gcccttgggg 
11240 

cccacttatt 
11300 

acagacaacc 
11360 

ccgcacccca 
11420 

ttttcttctg 
11480 

agtcgtctac 
11540 



atgcttcctt 
11250 

gacaagagat 
11310 

agttaagtta 

11370 

aaaacatcaa 
11430 

Catgtctcag 
11490 

tctgtggagc 
11550 



tcgcatcaac 
10960 

accaccaaac 
11020 

tagtggaaat 

iioeo 

taataaaagc 

11140 

atacccgggg 
11200 

ccttaaaatc 
11260 



atccatgcta 
10970 

ctaatcttat 
11030 

C tagcaaatc 
11090 

tagacagcac 
11150 

actgaccata 
11210 

tccttcactc 
11270 



tcaccaacag 
10960 

acactaatct 
11040 

ttttcttatg 
11100 

gaaaaaggtt 
11160 

99cacaggca 
11220 

acgttgccta 
11280 



atttgcgaca 
11320 

gagtcttaca 
11380 

gagggtccaa 
11440 

acacatcatg 
11500 

catcaaggtg 
11560 



tctgccatct 
11600 



tcctgcaaca 
11650 

gaacaatatg 
11710 

cqcgcgcatt 
11770 

CCgttgggtg 
11830 

cagatctggt 
11890 

agaaaaagtt 
11950 

gaactcaaag 
12010 



ggatatagtt 
11660 

gcctcactgc 
11720 

ggtctcatcc 
11780 

acaagagttt 
11840 

gaagtttaLc 
11900 

tgacaacctt 
11960 

aataacaaat 
12020 



ttgaggatgg 
11610 

tctcttttcc 
11670 

ataaatacat 
11730 

agcccctagg 
11790 

tcaaaggtaa 
11850 

aataatgata 
11910 

ggctgctctc 
11970 



aacagtggag 
11620 

ctcccttgaa 
11680 

attccccgct 
11740 

ttccattttc 
11600 

gtgtgtaggc 
11860 

agaaggttgc 
11920 



tgagaatcaa 
11330 

gacatccgaa 
11390 

gattccccag 
11450 

aaggaacctg 
11510 

aaacctacag 
11570 

gagaacattg 
11630 

gattcactcg 
11690 



gtcagaaaac 
11340 

aagccctttt 
11400 

caaacgatcc 
11460 

cactaaatga 
11520 

tgaaagagcc 
11580 

atgccatcac 
11640 

tcaaagtaga 
11700 



cacctggaca 
11750 

ccaaccgctg 
11810 

aggtgagtgg 
11870 

ctgagacaaa 
11930 



acaagactaa 
11980 



cattctaaaa 
11990 



taaaacatta 
12070 

ccttcgaacc 
12130 

ttgtttaaaa 
12190 

caacctcaca 
12250 

gtagcacttc 
12310 

cegcaaaagc 
12370 

taaacagatc 
12430 



gacagtcaag 
12080 

gtgagagata 
12140 

attcctcagc 
12200 

aatccctaca 
12260 

atactcctca 
12320 

ttactgaata 
12380 

atttcaacat 
12440 



acaggaattc 
12030 

agaatttcaa 
12090 

agtccaagaa 
12150 

atatctgcaa 
12210 

agtcataaaa 
12270 

gaacggtgct 
12330 

ccztgccctg 
12390 



agcaataata 
12040 

ctggcataaa 
12100 

aaagatctgt 
12160 

atcaattitaa 
12220 

tcactaaaag 
12280 

acctccctgc 
12340 

tgctgggaac 
12400 



aatacctgca 
12050 

gctaagtgca 
12110 



cccctggtct 
12170 

ctcttaatac 
12230 

gtttcttcct 

12290 

ctccaggg:: t 
12350 

tggtgggaca 
12410 



agtcaacccc 
11760 

aaccccaagc 
11820 

ctaagcgttc 
11880 

aaggttgcca 
11940 

agcLaccgga 
12000 

atcatccttt 
12O60 

tgttaacttt 
12120 

tacctctgtg 
12160 

-t^agcagct 
12240 

gggtgccigt 
12300 

c&attczgzz 
12360 

gagagaaatt 
12420 



aacatgacaa 
12450 



atgctttgat 
12460 



tgaataatat 
12470 



atggagtgct 
12460 
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iraanient3.FMQ2 



Ccccaaagca 
14050 

atttctgggc 
14110 

gcattcttat 
14170 

aagataagaa 
14230 

tacgatgcct 
14290 

ggaatgggac 
14350 

ccccaccaga 
14410 

tgaggcaaaa 
14470 



cagtga tcta 
14060 

tatagcccag 
14120 

ccccttccta 

uieo 

ttgtaccaaa 
14240 

atgtcagatt 
14300 

gagacagcgg 
14360 

acaaaccagg 
14420 



ac tacttaca 
14070 

atgattgaat 
14130 

agcgattctc 
14190 

ccagagcacc 
142S0 

ccacaactcc 
14310 

t99tgatagt 
14370 

aaggggttgg 
14430 



agaaccacct agctgcccga 
14080 14090 

cagaaactcc gtgcgtgagg 
14K0 14150 

atacatacta ggttaagaac 
14200 14210 

tctccttggc ttaatttcat 
14260 14270 

tcaagccacc tacactctgt 
14320 14330 

agcctgaata gctgcgaaaa 
14380 14390 

cgtgaaggct caaggattCg 
14440 14450 



caaaatgcaa 
14100 

ccaaaaagtc 
14160 

caaacactta 
14220 

ttcagtttta 
14260 

ggctagagag 
14340 

gccagagaac 
14400 

taccttgtga 
14460 



tgaggttcaa 
14480 



accaggcgta 
14530 

ctaccacacg 
14590 

cctcccttga 
14650 

gccgccctgg 
14710 

atggttacca 
14770 

ggcgtattct 
X4B30 

agactcat eg 
14890 

acgcccaata 
14950 



aagagtctcc 
14540 

ccacccagac 
14600 

gcaagacacc 
14660 

ctagcacgta 

14720 

atcttgtcac 
14780 

caatctgaga 
14840 

aaaactcatt 
14900 

tcctagaaaa 
14960 



cagcgatcga 
14490 

tcacgttcaa 
14550 

tgccaggcac 
14610 

aagctacgct 
14670 

cctgcctgga 
14730 

atttctagag 
14790 

tatgagcccc 
14850 

cacatatcca 
14910 

cttagaacat 
14970 



gcacccttgg aaagttgatt 
14S00 14510 

attcaaatct acctaagatc 
14560 14570 

cttagtaatt taacaagcaa 
14620 14630 

ttcatatgca ttatctcatg 
14680 14690 

gatctgccac cgcttaaaaa 
14740 14750 

catccatgaa ttcatggcte 
14800 14810 

ctggtatgat aaactcaaac 
14860 14870 

ctcattcctt catcccttta 
14920 14930 

tctgtgaaca ttcccttttt 
14980 14990 



ccaaggtttg 
15010 

gagcccgcct 
15070 

aaactggctg 
15130 

cctgggcaat 
15190 

ccac^caaga 
15250 

ar.cctgggcc 
15310 

gcataacgcL 
15370 

gc:;agaag2a 
15430 

ggtaaggcgg 
15450 

gtcatgaaat 
15550 



gagaaagcca 
15020 

tagaga tagg 
15080 

tgagactcta 
15140 

gggaaggatt 
15200 

ctcgggccct 
15260 

15320 

tLgggctcca 
15380 

aaaacattac 
15440 



tggggcttac 
14520 

gaccgagtat 
14580 

a taccaagca 
14640 

aactcctgca 
14700 

atgccaaaca 
14760 

tttatttgag 
14820 

ttcccaccag 
14880 

gcagttccga 
14940 

accttcttca 
15000 



gagccagacg 
15030 

tgcgaagcca 
15090 

tttcggaccc 
15150 

cagaaatgcc 
15210 

gaaggaccca 

15270 

igntgcggcc 
15330 

ctatcitgcc 
15390 

attcaig::cc 
15450 



aaaccgtaaa 

15500 

tttgccittc 
15560 



gaattagcag 
15510 

cacgcttccc 
15570 



tcgcagacca attatgtcga 
15040 15050 

gatttccgct ctctctcgtt 
15100 15110 

tgcaactcct attagtatcg 
15160 15X70 

atcctcaccc agaagcaaag 
15220 15230 

tc-aacttct cagtctc::tc 
15230 15290 

ti-itttgcc aacctcaatg 
15340 15350 

agicacwacc tcctaaagaa 
15400 15410 

taaccataga ttttagagtt 
15460 15470 

aae-aggcat acgtacaaaa 
15520 15530 

tcagitcacc aaagttacca 
15580 15590 



ctactcggac 
15060 

caaagatcct 
15120 

cctggctggg 
15180 

aacaccgaag 
15240 

cccgctgaaa 
15300 

gccctagtca 
15360 

aaaaaaaaag 

15420 

agg^agcaca 
15480 

ccaaaatctt 
15540 



aaacgtaaaa 
15500 
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caaaataaga 
15610 

aaaaacagta 
15670 

aaact9Cg99 
15730 

tacctggtaa 
15790 

tcaaaactac 
15850 

taaactttta 
15910 



ccggctcagg 
15620 

gaattacaca 
15680 

taaatattta 
1S740 

caaagttctc 
15800 

tagacaaaaa 
15860 

ggacctcaca 
15920 



caagcagcgc 
15630 

gcatgaaaag 
15690 

aaactcctga 
15750 

agatgt tagg 
15810 

dgtgagagga 
15870 



tgccaaccct 
15640 

cagcccacgg 
15700 

acaatgctcc 
15760 

tcatgtttca 
15820 

cagatttaga 
15680 



agagacactg 
15970 

cgctcaacgt 
16030 

tctaattctc 
16090 

wgaaactaag 
16150 

ttgaactcta 
16210 

tcattaccta 
16270 



ctggaaaaac 
15980 

C tacca tagg 
16040 

acaacaatcc 
16100 

actcagagca 
16160 

gaactaaaga 
16220 



ttaagagcca 
15930 

taaaaccaaa 
15990 

ccagacactg 
16050 

tgtgaaacgg 
16110 

gctgatcttg 
16170 

tcataatgtt 
16230 



agcaaacggc 
15940 

atgccataat 
16000 

tgctatgtgc 
16060 

caacagctat 
1(120 

tgaggcagcc 
16180 

gtctcgtaat 
16240 



gacacagggg 
1S650 

cccaaatcat 
15710 

tgatggcctc 
15770 

Cttgctcagt 
15830 

aaacatcagt 
15890 

cacatctccc 
15950 



<*5tcgtacgg 
15660 

tggacaattt 
15720 

ccatccaccc 
15780 

cggggaccac 
15840 

gatgctcaga 
15900 

atattttgac 
15960 



caaagaattt 

16280 



agctacctaa 
16010 

atatcacatg 
16070 

tacagtcatc 
16130 

ggaattggaa 
16190 

atatttattt 
16250 



tcgggaggcc 
16330 

tacttataat 
16390 

acgaaagata 
16450 

^tgaggaaaa 
16510 

atctaactcc 
16570 

taacatttgg 
16630 



ctttacatag 
16340 

tttcgatcta 
16400 

cctatgcaat 
16460 

aaagcgtatc 
16520 

agtcctacag 
16580 

taaaaggaag 
16640 



accaacagtt 
16290 

aaaacagcat 
16350 

tatttcagct 
16410 

aacatttagg 
16470 

tctcaagtag 
16530 

ataactaagg 
16590 

tatactggtc 
16650 



tatcccattt 
16300 

tctttttgct 
16360 

agatctaaaa 
16420 

ataatctttg 
16480 

acgcaaagca 
16540 

caaaaagcta 
16600 



atacccatac 
16310 

aaatatgacc 
16370 

agcatctgaa 
16430 

acact ttgga 
16490 

ttataatgat 
16550 



caaacatata 

16020 

taccacccca 
16080 

tcacagatga 
16140 

cccagatctg 
16200 

acaaaacacc 
16260 

atctgctact 
16320 

aaattacttt 
16380 

ggaatttaca 
16440 

aaaacaagaa 
16500 

tgacacctgc 
16560 



aacaaacaac 
16610 



gaagtctgaa 
16690 

aacatctcct 
16750 



tgctagcaga 
16660 



acaaacaaaa 
16700 

aagggaacat 
16760 



gacaaacttt 
16670 



taagctctgt cctgagtcca 
16810 16820 



gaagatccca 
16870 

-wttggcctg 
16930 

gctaaaactt 
16990 

9gaatg£cag 
17050 

agaerttaca 

-yiio 



gcaaacttct 
16880 

tacttctccc 
16940 

tctctitaaa 
17000 

ccagtctctg 
17060 

ggcaagattt 
17120 



gcaattcaat 
16710 

ttgttacagc 
16770 

aaccaagccc 
16830 

cctcttattt 
16890 

ccagggacgi 
16950 

acvcaaccaa 
1701O 

tagttaaaac 
17C70 



gtcaatagac 
16720 

tgccccttcc 
16780 

ttccaagaga 
16840 

ctaccaagcc 
16900 

agaacaacgg 
16960 

gttacttctc 

17020 
c wtttcttta 

17080 



attaagcaac 
16730 

ccgaactgcg 
16790 

gaacaaaggt 

I6S50 

tttgcgaaca 
16910 

aacgtcagtc 
16970 

cctcagggac 
17030 

aaactcaacc 
17090 



ittttttcat 
17130 



tgctcccaca 
17140 



agcaaamg 
17150 



acgtaacctc 
16620 

tcttagaatt 
16680 

acaacagaca 
16740 

ctccggaaga 
16800 

cagagacgtc 

16860 

w :gccc t wCa 
16920 

agtc-ctgca 
16930 

17040 

aagcracacc 
17100 

ttttaaaa-a 
17160 
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att^taaatg aggtatatac ctagttcttg gccaaaaaac atattqctcc 
17170 17180 17190 17200 17210 

aaagattatt tgtaagtcac tgtattaata acactaataa aatctaccaa 
17230 17240 17250 17260 17270 

caaggg&cag cgaattacca ctgcctgcgg gccaaatcta gctcactacc 
17290 17300 17310 17320 17330 

aataaaattt tataatagca cacagccaca ctcattcatt tattttctgt 
17350 17360 17370 17380 17390 

aagccacaat tgtagagttg ggtagtcgca acagaacccc tgtggcccac 
17410 17420 17430 17440 17450 

tatctacact cccacccatt acagaaaaag tttgataact cccgccccat 
17470 17480 17490 17S00 17510 

gcactqtccc attctgcata acctgcctta tttcatcatt atcactaccc 
17530 17540 17550 17560 17570 

catggttgtt atcttactcc tacagtggaa gagattgaaa agcacttgtc 
17590 17600 17610 17620 17630 

caaaccagcg cggaaataca gccc 
17650 17660 



gtcaagtaLC 
17220 

gccctcacag 
17280 

cgttcccgta 
17340 

ggttgctttc 
17400 

aaggctaaaa 
17460 

aacatgtaag 
17520 

acttagtagc 
17580 

aggctaacgc 
17640 
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splicmg_F M02 

position debut 



(5'UTR) 




3654 


exon 2 


CAG 


Its 4058 


exon 3 


CAC 


2» 320 


exon 4 


AAG 


3« 2856 


exon 5 


AAG 


3« 5551 


exon 6 


CAG 


3# 10076 


exon 7 


CAG 


3<f 11491 


exon e 


TAG 


^tt 13930 


exon 9 
O'OTR) 


AAG 


y» 15006 



position fin 
1^ 3709 



Site d'epissage 5' 
GTAAGG 



i;; 


4195 


GTAAGT 




508 


CTATTG 


2ii 


3018 


GTGACA 


2» 


5693 


GTGTGA 


3# 


10275 


GTAGAG 


3;; 


11846 


CTAAGT 


3t? 


14002 


GTAAGA 


3i; 


15419 
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Longueur % homologie Macaque/homme % homologie Macaque/homme 
Acides Amines adn 



64 

137 
188 
162 
142 
199 
355 

72 
413 



100 
98 

96.7 

9S.8 

95.4 

98.3 

96 

93 

96 



95.3 

96.5 
96.8 
96.9 
96.5 
97 

97.7 
97.2 
95 

96.7 
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sssassssssa 



56 
71 
83 
104 
197 
218 
266 
284 
344 
360 
404 
455 
482 
499 
510 
548 
604 
629 
650 
676 
725 
729 
743 
758 
811 
844 
995 
108S 
1121 
1133 
1145 
1155 
1157 
1160 
1251 
1252 
1370 
1448 
1450 
1473 
1484 
1486 
1509 
1510 
1514 
1516 
1535 
1541 
1556 
1567 
1590 
1598 
1623 
1646 
1677 
1678 



A 
A 
C 
G 
G 
C 
T 
C 
C 
T 
G 
T 
T 
C 
T 
C 
T 
C 
C 
G 
T 
G 
T 
G 
T 
A 
T 
T 
G 
A 
G 
T 
T 
A 
C 
A 
T 
G 
T 
C 
A 
C 
G 
C 
G 
G 
A 
G 
A 
T 
C 
C 
G 
C 
T 
G 



G 
G 
T 
A 
T 
T 
C 
T 
T 
C 
A 
C 

c 

G 

A 

G 

C 

T 

A 

A 

C 

A 

C 

A 

C 

G 

C 

C 

A 

C 

C 

c 
c 

G 
A 
G 
C 

c 

A 

N 

G 

T 

N 

N 
A 

A 
G 
A 
C 
C 
T 
T 
C 
T 
C 



non codant 



Lys -> Asn 



Ser -> Thr 
He -> Phe 
He -> Met 
Ser -> Phe 



Asn -> Ser 
Val -> He 



val -> Ala 
Arg -> Gin 



Glu -> Asp 
Phe -> Leu 



Ser -> His 
Ser -> His 



Tyr -> Phe 



1 
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Aligngment-mRNAFM02 . paoe. 



mRNApot AACCAAGGcLAAAACTAWTGTCAAAcScACGCmXcLLWGCAAlLvCA^^ 
Macaque C0C^CGAGGfJJJ^ikii6iisii-^Mi^m 

^° 20 30 40 50 

mRNApoC TGATCGCAAAGAAGGTAGCTGTG^^ 

Macaque TGATOarAAAGAAAGTAGCTCTCATCGG^^ 

*° '0 80 90 100 110 

130 140 150 160 170 lan 

mRNApot GCTCTGTTCATGAGGGACTTGAG^ 

Macaque CCTGTCTCGATCAGCC^iri^AGCCC^ 

130 140 150 160 170 

190 200 210 220 210 ■>An 

mSNApot TGTCCATCTTCAAAGAGA.ATGTGGAAGATGGCCGAGCAAGTATCTATCAATCTGTC^ 
Macaque ^ 



180 190 200 210 



220 230 



250 260 270 280 500 tnn 

mRNApot CCMCACCACCAAAGA^U^TGTCCTG^ 

Macaque CCA^iACcA«KAAA6AAiTCTCCT(^^ 

250 260 270 280 290 

mRNApot ACTTCCTGCATAATTCTA^CTTCTGGiI?A^^ 

Macaque AC^^CTaATAA^TiiAcTT^ 

jvu jio 320 330 340 350 

mRNApot TTCTAaJtATATTCACTTCC^^ 

Macaque TGr^AA^rATATTC^C-i^cicAGicA^^^ 

-» 380 390 400 410 

mRNApot CATCCTCTGGCCAATGGAAGGrrc^ 

Macaque CATCCTCT<i<icCA^TCGAAG6TTCTCi^ 

*30 440 450 460 470 

mRNApot TTGACaAG™«TTT«AGT^ 

Macaque jTcATGcAaTTAT(^-i4ii(iACT^ 

490 500 510 520 530 

r»NApot TTCCAGGTA?GGAGACcl^CAAAGGCC^ 

Macaque jjccicaTATCGAGAddTOAAACacU^^ 

= = 0 560 570 580 590 

620 630 640 f^a ten 

;r.-.KApot ATGGATCTGAGGGAAAACGCATCCTGGTGATTGGAATGGGA;.J^rTCGG^^^ 
Macaque ^^^T^i^G^jJ^GckxicTLcick^ 

610 o20 630 £40 650 

690 700 -10 720 

..Al.«pot CTGTTGAGCTGAGTAAGAATGCTGCTCAGGTTrrTATCAGCACCAGGCATGGCACCTGCG 
Macaque CTGTTGAMTGAGT^«AGTGCTi(^4cAi<^m 

fi'O 680 690 700 710 
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Alignement-mRNAFM02 . .„ . p^^^ ^ 



mRNApot yCATCACC^^TATCTCTclScATCGCTllc^CTrCGGAC^^ 
nOmApo. GTTCTAT^^?cCCC..Tl?LTCCCAcliScA^^^ 

Macaque cttctatcctccccaa™tactcc6a«^^ 

850 860 fl70 eon 

nU.NApocTGAATCGCrCCTTCAACC.TGAAAATTlT^CCTTGAlc^VAAA^ 

Mac,,ue TCAATCACTGCTT^..CCATCAAAATT^^^ 

oou QQQ 

n^HApot AGGAACC?^?ACTAAAT^?CATGTCcll^CTCCTCTi^?c^^^^^ 
Mac.,ue AGCAACCTCTACTAAATGAT^^^^^^ 

930 940 950 

^''0 980 Qcn tA«« 

-NApoc ttT?"ACACTGAAAGAaCTCACACAAAl^TCCCAic°$?TGACGA^^^^LcAGTG^^^^ 
Maca<^e MTCTACAGTGAA^GAG^^AC^^^^ 

990 1000 1010 

1030 1040 in^rt 

n««*ApoC AGAACATTCATGTCATCATrTTT«:Aic°A^,^^^^^ 

Maca,ue^ACAACA«..TGTCArCA^«;^^^^^ 

iw^u 1050 1060 1070 

Haca<,ue^A2TCACTTC„^GT«;CAA^^^^ 

n^KApot ACCTCci^^GTCAACC^^C^GCGTCci^^CTCTCA^^^^^^ 
Maca^.^.CCTGG.G...GTCAACCr^.i^Ai^^ 

C..NAPOC fttfT^T^^CTTCAi^^CGTrOG^^^LAAGAC^^AA..^^^ 
Haca<^e^CAACTCCTGA.CT^<^TCGT^^^^^^ 

1240 1250 

Maca^ue^CCTCAGACAGAACrAi^T^^^^^^ 

n.-:«Apc.TTGGAGi^^CC.GAa^^tLcGTTO^^!°CCAATTi^^^^ 
-ca,„eJTGGAaAAAGCCACACCCACACC^^ 

-'-•CAPO. 7f^70All?.GGTGcit^§cCAGAT^^?GCTCTCT^ 
Maca^ue^CCpSAGATAGCTGCGAAGCCp^CTGCTCTC^ 
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Alignement-rnRNApMQ2. 



1510 1520 1530 1540 1550 1560 

mRNApo t AATGGG AAGGATTCACAAATGCCATCTTCACCCAGAAGC AAAGA-a^TACTGAAGCCACTC A 

Macaque AATGGGAAGGAGCCAGGAGTCCCATCTTCACCCAGA^ 

1500 1510 1520 1530 1540 1550 

1570 1580 1590 1600 1610 1620 

maNApot AGACTCGGGCCCTGAAGGATTCATCTAATTTCTCAGTTTCTTTTCTGTTGAA.^ATCCTGG 

Macaque agactcgcgtcctcaaggattcatctaatttcccagtttcctttctgttgaaaatcctgc 

1560 1570 1580 1590 1600 1610 

1630 1640 1650 1660 1670 1680 

mRNApo t CCCTTCTTGCTGTTGTTGTGGCCTTTTTTTGCCAACTTC AATGGTCCTAGTC AGC ATAAT 

Macaque GCCTTGTTGCTGTTGTTGTGGCCTTTTTCTGCCAACTTCAATGGTCCTAGTCAGCATAAC 
1620 1630 1640 1650 1660 1670 

1690 1700 1710 1720 1730 

mRNApoC GCTTTGGGCTTTATTATCTTGTCAGTCACTACCTCCTAAAGAA-^AAAAA.\A 

Macaque ACTTTGGGCTTTATTATCTTGTCAGTCACTACCTCCTAAAGAAAAAAAAAAAAAAAAAA 
1680 1690 1700 1710 1720 1730 
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Alignement-ProfFMn? 



= i:>/b35 (96%), Positives = 524/535 (97%) 



Macaque: 
inRNApot: 
Macaque: 

mRNApot : 
Macaque : 
mSNApot : 
Macaque: 
mANApot : 
Macaque: 
mRNApot : 
Macaque : 
mANApo t .- 
Macaque : 
mRNApot: 
Macaque : 
mRNApot: 
Macaque: 



1 
1 
61 
61 
121 
121 
181 
181 
241 
241 
301 
301 
361 
361 
421 
421 
481 
481 



X.£KSTFACICLXOPLCSXrPTAEl5^K^:;;;?S[5H!:p%'L"S^ 
WECARSAXrTQKORXX.KPLKTRV.KDslN^p;;i^{:t^f{:^!:;^;^^^^^ „^ 



60 
60 
120 
120 
ISO 
160 
240 
240 
300 
300 
360 
360 
4 20 
420 
480 
480 
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II 



3 
G/G 



4 
G/A 



III 



6* f 



7 
G/G 



8 
G/A 




9 
G/A 



12 
G/A 



11 
G/A 



9 

10 
G/G 



IV 



13 
G/A 



14 
G/A 
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irjpgrnent1,FMQx. 



AAACAAGAAA GCTA^.CTCTC ACCCNTTCTA TTCAATGTAG AACTGA.:c:^CT CCTAGCCACA 
^" 20 30 40 50 60 

CAATCAAGCA AGAGAAAAAA AAATCAAATC AGAAATGAAA ATGGTA.:^^TT GCCTTTATTT 
SO 90 100 110 120 

ACAGTTGACA TCATATTTTA TATAGAAAGC CCTAAAGACT TCACCAAA.:»J^ CTTTTATA.^C 
^•'^ 150 160 170 180 

TAATAAACAC ATTCAGTAAA GTTGCAGGAT ACAAAATCAA CACTAAAAAA TCGATTGCAT 
200 210 220 230 240 

TTCCATACAC CAACAACAAA CTATCCAAAA AAGAAATTAA GAAAGAAATT CCATTTACAA 
260 270 280 290 300 

TACCATCAAA AAGAAAAAAT ACTTAGGAAT ACAATTAGCC AATAACCTGA AACATCTCGA 
320 330 340 350 360 

CATTTAAAAC TATAGTCTTT AAGGCAATTG AGGAAGACAC AAAAGAATGC AAAGATATTT 

390 400 410 420 

TGTGTTCATT AATTAATATT GTTAAAATGT CCATATAATC CAAAGCAATT TACATATTTA 

<50 460 470 480 

ATGCAATCCC TTTCAAAATA TAAATAGCAT TTTTCACACA AATATCAAAA AACATTCCTA 
500 510 520 530 540 

AAATTTATAT GGAACCAAAA ATATCCCAGA TAGCCAAAGC AATCTTGAGC AAAAAGAACA 

570 580 590 600 

AAGCTGGAAT CATCAGACTA CCTGATTTCA AAATATATTA CAAAGCTATA GTATTCAAAA 
"° ^20 630 640 650 660 

CAGTAATCTA CTCGCACCAA AACACACACA GACCAATGAA AGAGTATAGA GAGCCACGTA 
680 690 700 710 720 

ATTACCCACA CATATACAAC CAACTAATCT TTGACAAAAG TGCCAAGGAC ACACAATGAG 

750 760 770 780 

AAAAGCATAC TTTCTTCAAT AAATCCTGGT GGAAAAAATT GGATATCCAC ATCCAAAAGA 

810 820 830 840 

ATGAAATTGG ACCCTTAGCT CACACAATAT GCAAAAATTA ACTCAAAATA TATTAAACAC 
660 870 880 890 900 

TTAAACTGTA AGTATAACAT GTATATAAAT CATGAAACTG TAAAACTACT GAAAATAAAA 
^20 930 940 950 960 

ACATAGAGAC AAAGCTTTTT GAGATTTGTC TGGGCAATGA TTTTTTCAGA TATAACCCCA 

1000 1010 1020 

AAACCATAGG CAACAAAAGC AAAAAGGNGC CCAATGTGAC TGGCTTCAA.^ TTAAAAGGCT 
^^^^ 1050 1060 1070 1080 

TCTATTACAG ^AAAGGAAAC AACATACTGA ACAGACAACC TATAGAATGA CAGAAAAGAT 

1110 1120 1130 1140 

TTGCAAACCA ^GCATCTGAT ACGGGCTTAA TATCAAAATA TATAAGAAAC GTAAACATGT 
1160 1170 1180 1190 1200 

CAACAGCAAG *AAACAAATA ACCGGATTTT AAAATGGGTA AAGGACC7GA ATAAACATCT 
^220 1230 1240 1250 1260 

AAAAAA.:^^ TGGCCATATG AA.W..TGCC C:L^CATCACT AATCATCAGG A.:J^J.7CCTAA 
1^^° 12S0 1290 1300 1310 1320 

TCA^^CAAC -GATATCAC CTCACACCTA TTAGGATGGC TATTATCA.^LA AAGATGAAAG 
^^"^ 1350 1360 1370 1380 



ATAACAAGTG 
1390 



rCGTGAGGA TGTGGAGTAA AGGGAATCCT TGAATCCTGT TGATGGGAAT 
^**^0 1410 1420 1430 1440 

CTAAATTAGA ^-TAGCCATTA TGGGA^.ACAG TATGAAGGTT CCTCA.:l:^.AA GTAGAA.TAGA 
1-60 1470 1480 1490 1500 

ACTACCATAT GATTCTGCAA TCCTACCTCT GGGTATATAT CCACAGGACA TGAAATCAG7 
-^20 1530 I5i0 1550 1560 



Paga t. 
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leQO 1510 1620 

.r.CAAJC^ — oc.„ ..«^c^ ^^^^^^^^^ ^^^^^^^^^ 

CTCCA^T.^ .^.CCCTT ;^.0C^ ^ ^^^^^ ^^^J^^ 

''•'^O 1730 1740 

'°""-so --"-cc T.CCCCC.C. ;.c.c.;.„ ctc^.ttc 

1780 1790 1800 

-Acrx^ccT cc.c^^.. , ^^^^^^^ ^^^^^^^^^ 

•'OJU 1840 1850 1860 

"CC.CCCCC ™=.cccTca occ;^„c. cr^^„,, 

crc.rcc.cc ..c«.x.tct tctccac^tc t^^ctaca. r.rcorcIcT .tccttZ 

^^60 1970 1980 

^^^^0 '^"-^f^is 

-culo 2020 2030 2040 

AT^.CCT.J CTATC«ACC rCAT«CT„ CTTAAAT.GC TTATCTTTC .C;.rCCCa. 

^*JoO 2090 2100 

CATATATATA TATACGATGT TTTr^mrn-^ ^..^ 

2U0 "^212? "^"^"^"^^"S AGTTTTTATT TGTCATACAC 

^^^0 2160 

ccTrrGCATT cTccc^jc ccc;.cTTTc cc,..cc;«:r c^„oco.. 

2200 2210 



46*;aw 2220 

TCTccTc^o c^cc^oT ccc«x.ccT a.c;.c.«T «:c.ccc... «;v;.cc.c. 

2270 2280 

cArrrr^TT c.™:ttcaa actcctttct ou^ccjc. .0;^.^. 

CAC^CCCTC „^ J^^^ ^^^^^^^ 

-^^^ 2390 2400 

CTcrcTTACT .roro^r,, .cctc^c ^..cc.x.c rr^^ror .tctc^„c 

^*^0 2450 2460 

-^^^'O 2500 2S10 2S20 

TTCCT,^. ^CTTT^ ^ ^^^^^^^ 

2560 2S70 25BO 

CTGCCACATC TTAGTTGTAT TAATTGTCrr ar-r^^x . 

2590 2600 ^Jfao ""^^^I CCTAAGCCCC AGTCTTTCTT 

2620 2630 2640 

C.C^.C CCCCCr^ ..CTTCCC„ .x>.OC..CT TTTC^c. ;..;.CAT;. 

^b80 2690 2700 

TCCTCT^ ...^CTCC C.CCC.CTC. ..oCC.rTC T;^a.C.TT 

A^XTACTC „.„„CCC CC.C.^.c CTCCTCTC. CCCACtZ .CC. 

^BUO 2310 2820 

«.ACCATGTC TCAOAGTCTG CACTAG^.».C7 TAGC--rCCT' cr-r-^.— 

2230 2840 285^ 5fIo ^""^511^ ="="S?=C?T 

2870 2880 

..T.=..c=C ^^^^^^ ^^^^^ 

-™ -"-g c™ „_^2 _ 

^""^^SsS — 

.=c*-^5j c^jjjj ^^^^ 
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f rag^ment 1 . FMQx . . ^ " ' ' Page- 3 



TATATTGAGA ATAATAATAC CTGCCTCACA AGGTTAATGG AAGAAAATAA ATGAAA.^GCA 
3130 3140 3150 3160 3170 31B0 

CTTTGAAATA CGTGTCAGCA TTCTGAAGAT GTTCATTAAT CTCACTCTAT TCTTAATCCT 
3190 3200 3210 3220 3230 3240 



GTTCTTGGAG TGGCTAGTGT GAACCATTAG CGCCTGCA.^G CTCAGTGCTA TGACCTATAC 
3250 3260 3270 3280 3290 3300 

AGCCCTGAGC TTTAAGAGAA AAGCATGGAA CTTTAAGTAC AAGGAGACAT GGAAAGGCCA 
3310 3320 3330 3340 3350 3360 

CAGAGAGGTA GATTCCCAGC TGAGGCGGAG GTAGAGAAGC TCTGGAAATG ATCACCTTTA 
3370 3380 3390 3400 3410 3420 

TCCCTTGCCT TAACATATCT CTTCCTCCTG GGTCCTCCAT AGTACTCAGG GTCAGCCTCA 
3430 3440 3450 3460 3470 3480 

AGATGGTTCA CCAGTAGAGA ACTGCTGGCG CTGAAGAAGA AGAAGACACT CTGGACAATC 
3490 3500 3510 3520 3530 3540 

TTCTCCCCTT GTTTCATGAT CTTGCTCACT TTGGCCTATC AAATAACTCC ACGGACTTCA 
3550 3560 3570 3580 3590 3600 

TC7TTTAGTT GATTAAGTAC CTGGGATACC ACCTTCTTAT AGCTCTAAAG ACACTGCCAA 
3610 3620 3630 3640 3650 3660 

CCTATCAGA.:. TGCAGGGGGA GGCAGGAGAT CCACAAGGTC TGATTTTCCT GATCATTTTT 
3670 3680 3690 3700 3710 3720 

CACTAACAGC ACTTTCTGTG ATCTCATTAA ATCACAAATG CACTCTCAAT CCCGAAAATA 
3730 3740 3750 3760 3770 3780 

CATCCCATCA TATGTGATAA TCAAAACCTT CCACTTTACT TTCAGCTGTA ATCTTTTCAG 
3790 3800 3810 3820 3830 3840 

TATTACCTTC AGCTGAACCT GCAGCTACGA GAAGCCTGAG GTCCTGGAAG GCAAGCATGA 
3850 3860 3870 3880 3890 3900 

CGCTTTTCTC CTATATCGCC TTATGCTTCC ACTCCTCCTC CCCATGATGC TGATGGAAAA 
3910 3920 3930 3940 3950 3960 

GTT7CCAACC CTTTCAGAAA ATTATATTTT CTGTCTTTGA AAAGCTGACA TTTTACAAAT 
3970 3980 3990 4D00 4010 4020 

CTCTTAATTT CCTTAATACA CTGAGGTGTA TGCAGGAAAT TAAGAGATTT GTAAAATGTT 
4030 4040 4050 4060 4070 4080 

GAAGGGATAT TAGTAATTAC TTAATCCAAT TTGCTTATCT TACAGGGGAA GGATC7AAAT 
4090 4100 4110 4120 4130 4140 

TCCTGCAACA ATTATCCCAA AATATACAGC CAAAGAGATG AATCACTGAG TTTTTAACTA 
4150 4160 4170 4180 4190 4200 

TAATATTAGA TAACAGTATG AATATTTTTA AAATTTATAA GAAGACAGAA C7GCCTTTCA 
4210 4220 4230 4240 4250 4260 

TTTAATATCA TACGTATTAC AAGAATTGGA AAGCTAAAAA ACCACATTTC TAAGACTCTC 
4270 4280 4290 4300 4310 4320 

TTGCAGTTAG GGATTGGATG CAATTAGTTT TGCCAGTGAG ACAGACATCT AGGC7CAGAA 
-330 4340 4350 4360 4370 4330 

GGC;^JLAGGGA AGC.=AAAGCT AAATTTTCGT GACAATGCTG ATGGGC>J.-iT C-ATTCC-^C 
4390 4400 4410 4420 4430 4440 

AGGTGTGCTT ATATCAGCTG AACTCCA7GT 7CCACC7T7T AGCCCCCCA-A r?TGrA7G77 
4450 4450 4470 4480 4490 4500 

GCAGGCATC7 G7GGTGAT7G AAGCAG7TTC CTGCCCTC7G GA7AG7AGC7 C7AG7GG'^G-^ 
<510 4520 4530 4540 4550 4560 

GACCTCTCCA G7CC7GCAGC AACC7CC7AG T7CC7GCTC7 7TCAGC7C7T TGACCT777G 
4570 45S0 4590 4600 461C 4520 

CAAGCACC7A ATTCCCTG7A G7ATA7ACC7 TTCT7CATGA TATA7AG7G7 7777rATCTC 
4630 4640 4650 4660 4670 4680 
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ACTTTTGCTG 
4750 

AATATCTCAT 
4610 

TCAGTCTCTC 
4870 

AGTCACCATC 
4930 

GTTCAAAATT 
4990 

GGCACTTCAG 
5050 



AGGCATTAAG 
4760 

ATATCCTGTC 
4820 

TGGCCTAGAT 
4880 

CTCTCTAGCC 
4940 

CTCGAATGGA 
5000 

TATCCTTCAT 
5060 



CATATA.*VTCA 
4770 

TCCATTATCC 
4830 

TGTTCAAATA 
4890 

TCCAGGTGAA 
4950 

CAACCGTAAT 
5010 

AACCTATGTC 
5070 



GTCAGCAGGT 
4780 

ATTCCTCTAA 
4840 

ACATCCTCCG 
4900 

TCTGATCTTG 
4960 

CCAGAAGGTA 
S020 



CCCCA.AACAT 
4790 

TGCTACTCTA 
4850 

TTTTTCCTCT 
4910 

TCTGATGTTG 
4970 

GTATCCAAAC 
5030 



CTAATTCCTG 
4800 

ATTTAAGTCC 
4860 

CCTTGATTCT 
4920 

TCACTTCCTT 
4980 

CTGTGATTGT 
5040 



CATCACTTAT 
5110 

TTTCTATGCA 
5170 

GTCTGGAAAA 
5230 

TCTCTTTCCT 
5290 

CCATACTTCC 
5350 



GGTCCAGCAA 
5120 

TTTTCACATA 
5180 

CATCTATTCT 
5240 

CCTCCAACTG 
5300 

ACTGTGACAT 
5360 



AACTGAACTA 
S130 

TTTTTCTCTC 
5190 

TCCTTCAAGA 
5250 

GACCTAGATT 
5310 

TTATCATCTC 
5370 



GAAAGCACTG 
5410 

TACTAGGCTG 
5470 

CAGAAAGGAC 
5530 

TGTCTTTTGA 
5590 

TCAGGCCCTA 
5650 

CATTATAGTC 
5710 



TGTCTTCTCA 
5420 

TCAGTACAGT 
5480 

AGCTATAGAA 
5540 

GTTCACTACT 
5600 

AGTTTCCAGA 
5660 

CAGGTGCATA 
5720 



CTGCATGTTT 
5080 

ATTGTACTTC 
5140 

TGCCTTTTTT 
5200 

CTCAGCTGTC 
5260 

TTTCTTCCTA 
5320 

CCTCAACACT 
5380 



AACCCATATT 
5090 

CCCCATCACG 
5150 

CTATTTCTTG 
5210 

TTCTCACACT 
5270 

CATGCTAGCA 
5330 



TTGCTATTCC 
5100 

TGTTCTTACT 
5160 

TCCCTTATCT 
5220 

CCTTGAAGCC 
5280 

CTACACTGAA 
5340 



CCTTTGAATC 
5430 

GAAAGGAATG 
5490 

GCCGGAGGGA 
5550 

TTTACAAGCT 
5610 

AATTTCAGCT 
5670 

GCCTTTGTTT 
5730 



ATGAAAGAAT 
5770 

TGCCAGTCAC 
5830 

CTACCCCTTT 
5990 

TCGTCCTTCT 
5950 

GGAAT77TAC 
6010 

TTAAATGCCA 
6070 



CCCCAAAAGA 
5440 

GCCAGAGCAA 

5500 

CCCAGAGACA 
5560 

CATCTATAAG 
5620 

ACTTTTCACT 
5680 

ATATATTCTA 
5740 



AGACTTCATG 
5390 

CTATTATAAT 
5450 

GGAAAGGACG 
5510 

AGGTTCAGAG 
5570 

CGTTAGTTCA 
5630 

GTTGGCACAA 
5690 



GTTCCAGATG 
5400 

GCATGACATA 
5460 

GAAACAGAAG 
5520 

ACCACAATTC 
55B0 

GCAACTCAGA 
5640 



CATTGTTCCC 
5780 

TGTTTTATAT 
5840 

CTTTTTACTT 
5900 

CTTTCAGATT 
5960 

TTTAAGAATA 
6020 

7TC7CTTCCA 
6080 



TTGCTTAAGA 
6130 

TATCATGCAG 
61S0 



GGTGAAGTCC 
6140 

CAGGCTGGAT 
6200 



CTAATCTCCC 
5790 

TTTTTGTAAC 
5850 

CACCCATGCC 
5910 

TTACTATGGC 
5970 

ACTCCTCCCC 
6030 

CATTTCGAGA 
6090 

C7TAGAGCAT 
6150 



AGGAGTTTCA 
5600 

AAGAACCAAA 
5660 

7CCCC7G77C 
5920 

7CTA7ACCA7 
5980 

C77CCCCAG7 
6040 



TATTTCCAAA 
5750 

CCTTACAGCT 
5810 



CACTTCATTC 
5870 

77C7C7TA7C 
5930 

7AAAA.n7ACA 
5990 

777CACA7CA 
6050 



ACTGC7GA77 
6100 

TCAAAA7GAG 
6160 



G7CTAG77CC 
6210 



AA77CCT77A 
6220 



CTC7GGGGAG 
6110 

GAG7GA77C7 
6170 

777G77ACC7 
6230 



CAAAACGTTT 
5700 

GCAAACATAA 
5760 

CCAGTGGCCA 
5820 

TTCCTTTTTC 
5880 

CC7ACCACAC 
5940 

AGAAAAAAAA 
6000 

A.^u^GACA7TG 
6060 

AGA.iAGG7GA 
6120 

G7ACAGAGGA 
6160 

C7GAGACC77 
6240 
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, fragment , 



GAAGAAGTAG 
6250 

TGATGATCTT 
6310 

TGAATAATCA 
6370 

AGCATATACT 
6430 

AAACCTTGCC 
6490 

GATGTTCTCT 
6550 

CTGGAGTCAG 
6610 

GCTTTGAAAG 
6670 

TAGAACACCA 
6730 

AGATTTAGAA 
6790 



TTTCTAGTCT 
6260 

CAAGGTCCTT 
6320 

GAAGCAGCCA 
6380 

ATCAATGTGC 
6440 

TGATAATTTC 
6500 

CCAGACTCTG 
6560 

TGGCTTGGCT 
6620 

CAGCGATGAT 
6680 

GTGGAAGGAG 
6740 

GGCAGATCAC 
6600 



CAGCATACCA 
6270 

CCTGCTCTAG 
6330 

GTTTTAGAAT 
6390 

ATCTATGTCT 
6450 

TACTGAAAAA 
6S10 

CTACAGGCAA 
6570 

GCCATATGGT 
6630 

GTTGGAGGCC 
6690 

ATGGATTCCA 
6750 

AAAAGCTCCA 
6810 



AAGCGTCATC 
6280 

CATTCACTGA 
6340 

CTTATTATAG 
6400 

TCTTATGTTT 
6460 

AATCGTAAGT 
6520 

TCATGACCAA 
6580 

GCTGTCTGCA 
6640 

TGTGGAAATT 
6700 

ATGCAAATCA 
6760 

AATCTGGAAA 
6820 



TCATACTAAT 
6850 

TTTCAGCTCA 
6910 



NGCCCAAAAA 
6860 

TTAAACATCA 

6920 



GCACTAATCT TGGTAATTAT 



6970 


6980 


TCTATTCTTT 


ATTGCTCTTA 


7030 


7040 


GACTGAGATC 


CTGAGGTCAG 


7090 


7100 


AGATAAGATT 


TCAGTCCAGT 


7150 


7160 


TGCAGAGCAT 


ATGATTCTAT 


7210 


7220 


ATGATGATTG 


TGTGTGCGGC 


7270 


7280 


TATGGTCTTT 


GCCATTTGGG 


7330 


7340 


AACACATTTT 


TTTTTAAATT 


7390 


7400 


GGATTTCCCA 


GCCATTGTAA 


7450 


7460 


ACA7CATTCA 


TATTGTAACT 


7510 


7520 


ATAGCCTCCT 


CCAATAGAGT 


7570 


7580 


AGCTTTTTTT 


AAAAAAAATT 


7630 


7640 


TCATTA;i.TTT 


T7ATTTCCCA 


7650 


770O 


TT7TCCCTAT 


TTACATTTGC ' 


7750 


7760 



AACTATTTCA 
6870 

TCACCTGCAT 
6930 

TCAAAAATAT 
6990 

AATGCCAGGA 
7050 

AAGTCCTGAG 
7110 

TGCTTTTGTT 
7170 

AATTAACTTA 
7230 

TGTTGAATAG 
7290 

CTCATTGTAG 
7350 

TCAAAGCCAA 
7410 

TCAGTTGTCG 
7470 



TACCAGCAAA 
6880 

GGTGAAATCC 
6940 

ACCATGGGCT 
7000 

ACACGACTAG 
7060 

TTCTAATTTC 
7120 

TCCCTCGACC 
7180 

TGTCTATTGG 
7240 

CCTATCAGCT 
7300 

AAATAATATA 
7360 

GTTTGGAGAA 
7420 

ATGATACATA 
7480 



TGCA.2iTTGAG 
6290 

ATCTGCTATT 
6350 

CAAAAGTGGT 
6410 

GAGTGAGGAT 
6470 

ATTAAAGACA 
6530 

GAGGCrrGGC 
6590 

GGAGGGGCTG 
6650 

CTCAGTGAGT 
6710 

AATCTGATCA 
6770 

GTAAAATCTT 
6830 

ATTTGTCCTG 
6690 



AGCATTGGAT 
6300 

TTTGACATAT 
6360 

AAAAATA-^TG 
6420 

CCTCATACAT 
6480 

CTCTTCTGAA 
6540 

ATCATCGGAC 
6600 

GAGCCCACTT 
6660 

GGCACATCAT 
6720 

GTTCTAATTC 
6760 

ACCTCTCCAA 
684 0 

AAAAGGACAT 
6900 



AGATCTCCAA 
6950 

TCCCACGTAA 
7010 

AAAAGAGACA 
7070 

AACTTGTAGG 
7130 

TCAAATGCTC 
7190 

GCAGATAGAG 
7250 

CCAAATCCAG 
7310 

ATTAGGAAAT 
7370 

ACTTCTAGTT 
7430 

TTTGGCTTGA 
7490 



AC7TCCTGTC 
7530 

ATATCAGTGC 
7590 

G7GGTT7TG7 
7550 

G7A<GGGGG7A 
7710 



7770 



C7GG7C7CAG 
7540 

7AAC77AGAA 
7600 

AACCC7GAAA 
7660 

A7CAAGAGrr 
7720 

G7GGACAGC7 
7780 



77AC7GC7C7 
7550 

CACA77777A 
7610 

GCAC7CCA7G 
7670 

AA7A77777C 
7730 

TAGAC7A.iA7 
77S0 



CCTGTAAAGG 
6960 

CTGAAACAAT 
7020 

AACAAACC7G 
7080 

TrT7C7AGGC 
7140 

ATTTG7CAAA 
7200 

ATTATTATAG 
7260 

AGGGAAAAA7 
7320 

ACTCCTTGTA 
7380 

C7TC7G7CC7 
7440 

AAACA7A77C 
7500 

GCC7GCGCCA 
7560 

* iC77C7CCA 
7S20 

AGA.7A7AAGG 
7680 



CA7AAAA7CC 
7800 
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TGCTAAGTAC 
7870 

ATTTGATTAA 
7930 

TCATTTGATA 
7990 

ATGAAGCTAA 
6050 

TGCCCCAGAT 
8110 

TATATCTGGC 
8170 



TGGGATGACA 
7880 

GCAAGCCATA 
7940 

GCCGAACCTC 
8000 

GTCTCACCTT 
8060 

CTCACTAGCA 
8120 

CCTAAGACTT 

eieo 



AATATGGAAT 
7890 

ATATAATTCC 
7950 

TTCTGAAATC 
8010 

CTGTTCCACG 
8070 

GTATTATGGA 
8130 



ATAATCACTC 
7900 

GTAATCCTTT 
7960 

GTAAGGTTAA 
8020 

GCAGAAATTT 
8080 

GCAAAATCCA 
8140 



TTAAAATAAG 
8190 



CTTGTCACCA 
8230 

AAATCTTAGT 
8290 

CCCAGACAAG 
83S0 

TAAAGTCTCC 
8410 

CTTAAGAGAG 
8470 



TCAATTCAAT 
8240 

AGGTCAAAGA 
8300 

CAAAATAGAG 
8360 

GAATGGCACT 
6420 

ACCAACAATC 
8480 



GAGACGGATC 
8530 

AATATCATAC 
8590 

TTCTTCTTTT 
8650 

TATGGACCCA 
8710 

TTTTCTTACA 
8770 

ACATAAGACT 
8830 



CATGAGTTAT 
8540 

AAAGATCAGT 
8600 

CCATAAGGTC 
8660 

TACAAATACT 
8720 

AAAGTTCCTT 
8780 

7TATCTTGTN 
8640 



GGACGAGTGC 
8250 

AAACCTCCCA 
8310 

GACCACCTGT 
8370 

CCATAGGCCT 
8430 

CATGAAAGGC 
8490 

CCAATATACC 
8550 



AGATTATATA 
8200 

CTCGAGCGTT 
8260 

CAGCGATGAC 
8320 

GACACAACTC 
8380 

ATGCAGTCAT 
6440 

ACAGAAAAGC 
8500 



GATAGCAAA? 

7970 

ATACCCTGAA 
8030 

TATTGCATTT 
8090 

AAAATGTACA 
8150 

ACTACAACAA 
8210 



CGGCAAAAAC 
7980 

TTGGATCAAC 
8040 

GACAGATTGC 
8100 

CATTCCAAAA 
6160 

CAAGATAGAC 
8220 



TAGAAGACGG 
8270 

ACTTAGCCTT 
8330 

CTAGAGAGTG 
8390 

TGGCAGTCTC 
8450 

CAATCAACAT 
8510 



AAGATTCAAA 
8610 

ATGTCTATAA 
8670 

CAAAACTTTA 
8730 

GGCACAATAT 
8790 

AAGNCTTTTT 
8850 



GGTAAT7CTG 
8890 

AATACTAGCA 
S95D 

CCTCAAAAGA 
9010 

CATGCCTATA 
9070 



CAGATCAGAA 
8560 

GTTGGATTCT 
8620 

GCAAAATTCT 
8680 

CCCTCCTCCA 
8740 

ATAATCAGAG 
8800 

TNCAGAAGGT 
8860 



AGTTTACTTA 
8570 

GAGTTATCCA 
8630 

ACTCAAACTC 
8690 

CATACCCCAG 
8750 



TGGACTACGG 
8280 

GAAGGATAAC 
8340 

CATTTCCCAA 
8400 

CCAGCACCAG 
8460 

GGTCTGTGCA 
8520 

ACGAAGCAAT 
8580 

CAAGAGGAAA 
6640 

CTGGTGAGGA 
8700 

CCCTTCC7TC 
8760 



5120 

CCAGGTGTGo 
3190 

TC?TG.=L.-.CCC 
?250 

GGGCAATAGA 
= 310 



AACTTTTCAC 
8900 

GGCTGAATGT 
8960 

TTTCATTACT 
9020 

ATCCCAGCAC 
9080 

GCCTGGCCAA 
9140 

TGGTGGGTGC 
5200 



AGGGATTTT7 
S310 

GTTCTAGCAG 
8870 



TATTTGCTTT 
8910 

GTGTTTTAAG 
8970 

GCTGTA.^TAA 
9030 

TTTGGGAGGC 
9090 

CACAGAAAAA 
9150 

CTGTAA7CCC 
5210 



TTCTGAGAAA 
8920 

TTTCATCCAC 
8980 

GAAGTTGCTC 
9040 

CAAAGCGGG7 
9100 

CCCCATC7CT 
9160 

AGCTACTCAG 
9220 



TGAAAACCAA 
8930 

TCCTAAATAG 
6990 

AACAGCCAGG 
9C50 

GGA7CACGAG 
9110 

ACTAAA.-_^CA 
9170 

GAGGCTGAGG 
9230 



AGGAGGCAGA 
5260 

GAAAGAC7CC 
9320 



GG77GCAGTG 
5270 

Ar7AAAAAAA 
5330 



ACCTZAGATC 
9280 

A.-AA.AAATGC 
9340 



ATGCCACTGC 
529C 

7TA 



*ATGTGTT 
6820 

ACAGAAACGT 
6680 

A7GGGATTTA 
8940 

GGCC7CG7GT 
9000 

TGCGGTGCCT 
9060 

AGGTCAGGAG 
9120 

C A-AAAA77AG 
SIBO 

CAGGAGAi7C 
9240 

AC7CCAGCC7 
5200 



6 



BNSDOCID: <FR 2756845A 1 _!_> 



2756845 

35/53 
Figure 1 0 (suite) 



fragment2.FMOx .... — - - paqe^^ 



aaaaaaacgc ttaccaatag gttagtagca tCLtgattgc aaaagccgaa aacaggacta 
20 30 40 50 60 

ttttgaaccc tttcccaccc acctattcct tcgttcattc aatgaataca tactgtgtac 
^° 80 90 100 110 " "120 

cctatgcgta gggtactaca ctaagcataa gctgcagata agaggccagc cagcacttta 
140 ISO 160 170 180 

aaagccgtga gaaaacaagt atcagaataa ctataagtga ctatacaatc agggcaacaa 
200 210 220 230 240 

ggataatggg ^ccttagtaa aactaaagat gacttggcag tagctgagag ggaaggtaaa 
260 270 280 290 300 

gaaagccacg acaaagttga aggcaacttc cgagcatatt tcaagggcat atttagacaa 
320 330 340 350 360 

ggagacatgg gactcataag cagagctgga ataggaaaga agatcaaggt aaactgccta 
-*^0 380 390 400 410 420 

gatgcatgta caacattctg aaatcaacct ctgactttgc cctcaagtta cttatgttcc 
''^O <50 460 470 480 

cgtgggaaag atgagagatg aacacggtta tcatccaaga cagatggtgc ccacagctgc 
500 510 520 530 540 

tcagatctct ggttccaggg taaagccccc tcagccagag gcagagtcaa agttgaattt 
560 570 580 590 600 

c«cc«a=c „ctcaaa=c ac.cctceta t.^aaat.ac a.aaat,=« ,cccccc|,a 

,caa«,acc cgttacctaa cacacctgcc ttcct,.,« t,«t„a,a aca,ccc«c 

cgaaaaaatt ccaaggagct gtagtgtaca "ctcttctc tectggtgtt ataattggct 

gaggccaagg ,,=aaaaaa, cagaga.cca tt=aa,a.,g aaa.ac.cca a,gcccta,c 

atctgtttcc cagaacagag tctcacactc "caaccag, ctccacccca cagttcagcc 

870 880 890 900 

ctgcctccct tcaacaggca getgaaaaaa cctccttccc acctctcctt ctcacaacca 
»10 920 930 940 950 960 

ccagtagaag gcgccagc.g tggg.gaaag ggaagcaccc agcctgccaa accgctggac 

at,a,ccc.c a=c«.c..= .gacctccac aaaaa..cta aaaagcc.aa ae.cc.g.gc 

ccccacgc.. -cgagaaaca cagcaacca. gaacagagga agactatgct »caacctga 

gaaaaaatac egaggccttg ggcagccccc cacttcccca cggggacaca atcccctcaa 

1"" 1180 1190 1200 

ccc.cccca, caccc.ccgt t.ccc.c.cc cagagg.cat ctgg.gtgag agggagacac 

^cacc-.jgaa .ccagcagca acg.gaca.. cca.c.cc.t cccccca-..g cacaagag.c 

cc.cccggac cccgggaagc agaagc^cc agc.ccgaaa .gcac.ccca aggcagcaca 

ttgtgtgcac cjttacccta ccctcacaac tgagaggaaa tgtttatttt caattta^c-. 

KOO 1410 1420 1430 1440 

■"'"rl?; "^'^^'^rZ-^ tcaatcacac agaggcrtta aaatgaa?t, 

-570 1480 1490 1300 

ccaagatcta acacatgttc taagggcict ggtttccrgt gtttctttgg cgag=ac-oe 
_ "10 1520 1530 1S40 1S50 ^ fsfS 
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frag.ment2.FM0x 



Page.2. 



agtccagcaa 
1570 

agcgcggccc 
1630 

cccccagact 
1690 

tacggtctag 

1750 

attgggttgt 
1610 

ccagagcctc 
1870 

gaaccagcgg 
1930 

caccgagggc 
1990 



ccggtgagcc 
1S60 

ctaaaccagc 
1640 

ccaccccaga 
1700 

ggagcttcca 
1760 

tgccagtgaa 
1820 

ttctagacag 
1880 

tggcacagga 
1940 



aaagaatagg 
1590 

cacaccagca 
1650 

cagattgaac 
1710 

ggcgattctc 
1770 

gagtttgcta 
1830 

ttttgttctc 
1690 

gaaagcaaaa 
1950 



attcattcac 
1600 

ccaccaggaa 
1660 

ccgaaattct 

1720 

attacgccaa 
1780 

aac&ccaaaa 
1840 

tgtttttttt 
1900 

accactaagc 
1960 



aacagagcag 
1610 

ctcgatagaa 
1670 

aagaa taggg 
1730 

agctgggaaa 
1790 

gcaaacaaac 
18S0 

ttaacctgag 
1910 



cggtccccaa 

1620 

acgcaaaaca 
1660 

cccaagaatc 
1740 

ccaccgcaac 
1800 

aggccagaag 
1860 

tataagatca 
1920 



ggccacaaag 
1970 



aattacagta 
2000 



Cacgcgaagg 
2050 

caaacatgaa 
2110 

acaattcttg 

2170 

agagccagca 
2230 

gacttccctt 
2290 

ataaagacat 
2350 

tcataacttg 
2410 



gctttccatc 
2060 

aagggcttta 
2120 

gctttctctt 
2180 

ctcaccagtc 
2240 

atccggatga 
2300 

atgctcaaaa 
2360 

cactgtcgaa 
2420 



agaggatcca 
2010 

cctcatctta 
2070 

gtcaaccaag 
2130 

taagctttct 
2190 

tgtactcaca 
2250 

ttacccaaac 
2310 

gaaggaactc 
2370 



catggaaaga 
2020 

ccgagagccc 
2080 

aatcgaacca 
2140 

tattctccct 
2200 

aacccttcca 
2260 

tatatacacc 
2320 

tcaagataca 

2380 



gctccagttc 
2030 

tcaattctcg 
2090 

ctgtg ttcac 
2150 

aggaccacac 
2210 

aagaaatgac 

2270 

acagcaagct 
2330 



tatagtttga 
2390 



ctatcataaa 
2470 

tataaagcat 
2530 

gagctttcag 
2590 

ctcatgctct 
2650 

cagcccaatg 
2710 

wCacacLdtg 
2770 

ccacrcag- 
2830 

a::aa-gtctt 
2890 



aattagagcc 
2480 

tcatgcatcg 
2540 

actaccttag 
2600 

gatgttttgg 
2660 

ccaatgagct 
2720 

aaaaggttaa 
2780 

catcagtttt 
2840 

acatt cattt 
2900 



attaagatat 
24 30 

aaacgcctgg 
2490 

attttttctc 
2550 

aaaacggagg 
2610 

aaacaatcca 
2670 

gtggctcaaa 
2730 

caacttaaat 
2790 

tctattaaaa 
2850 

gggacLcttt 

2910 



gtgtgggtta 
2440 

gcaccccagc 
2500 

tcccagacct 
2560 

cagccagccc 
2620 

aaatgcttta 
2680 

aaaccagagc 
2740 

gggaaatata 
2800 

aggtgagatt 
2660 

atigagcatc 
2920 



gagaaaaagg 
2450 

aatcaaatgt 
2510 



tccLaacctc 
2950 

cagcasaatt 
3010 

tgLatagrta 
3.07C 



actagttcac 
2570 

atcattgtcc 
2630 

gtatatatca 
2690 

atttggcagg 
2750 

gtcattgccc 
2610 

wcagcatcgt 
2870 

tctgtccgca 
293C 



acagagcLaa 
1980 

cgtgccaggt 
2040 

tt cacgcttt 
2100 

cgaagggaac 
2160 

agaagaaggc 
2220 

gtgctttcca 
2280 

ccaggaatac 
2340 

ggcaggggtc 
2400 

aggcagcaaa 
2460 

tgggtctgac 
2520 

tagcctccga 
2580 

accttccacc 
2640 



aatcaactgc 
2960 

atgaacca tg 
3020 



cgcraaaLgc 
2970 

g-gacciLta 
3030 



agaacacccg 
2960 

catcatcatt 
3O40 



cacatacigg 
2990 

tcacctggag 
3050 



ggaaccctgc 
2700 

gttcctccca 
2760 

ccatctctac 
2820 

itcrgcgaga 
2880 

cgcLr^gaac 
2940 

gaaaaacaat 
3000 

tagccccaaa 
3060 
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fragment2^.FM€)x>?r 



Pa9#3^ 



ttgctcccat tatggcgtta atatcaacaa acattaatga agttcctatt gcgtgcttgc 
3130 3140 3150 3160 3170 3180 

attgtgctat gtgttatacg taaaagaaaa agaggtctaa gacttagctc ccaagaagtc 
3190 3200 3210 3220 3230 3240 

acctcaaaat aaacacgtaa agagtaagta aaaagattcc agcaacaatt tcaaccaaag 
3250 3260 3270 3200 3290 3300 

agaaaatttt ttaaagctct ttacgatttg tttataaaca aaacaacgct atggagatca 
3310 3320 3330 33<0 3350 3360 

tgaagcaaga ggcaacactt tgggggaagg tattttctag aggaggcaaa attcagttgt 
3370 3380 3390 3400 3410 3420 

atttagtagg tgttttagat aaatgagtgg catgagtaaa attagagagg tgggaaaatg 
3430 3440 3450 3460 3470 3480 

ccctgctcac tcggagaaca gtgggcaaac caagttggtt aggagggaga catatacgct 
3490 3500 3510 3520 3530 3540 

aggatgagat atggccacac atatcagtaa actagtgtgt actgtgaccc tgaaaaatag 
3550 3560 3570 3580 3590 3600 

aggattaccc tgcaaccatg taaaagaagt ccaaagaagg gacatccaga gcttatgtga 
3610 3620 3630 3640 3650 3660 

Cggcaccaaa gtcatcaaag attcagcttc acccacctta gcaccgtggc ccacaccacg 
3670 3680 3690 3700 3710 3720 

acgtttgcct tgtggtgcaa aacagttgct gaagcttgag ccgccacacc tgccttctag 
3730 3740 3750 3760 3770 3780 

gcaaaaaaaa aaaa 



3790 
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tttttttttt 

10 

9caacctC99 
70 

Cccrgagcag 
130 

agc&gagacg 
190 

acccgccccg 
250 

aagttgccac 
310 

aaccttgaga 
370 

gccatgccag 
430 



tttttttgag 
20 

cccactgcaa 
60 

ccgggactac 
140 

gggcccacca 
200 

gccccccaaa 
2S0 

accLctaaga 
320 

tattcccata 
360 



acggagtctc 
30 

cctccgcctc 
90 

aggcgcccgc 
150 

tgctagccag 
210 

9t9Ctgggat 
270 

caagagtatt 
330 

cttattgagc 
390 



gctctgtcgc 
40 

ccgggttcac 
100 

caccacgccc 
160 

gatggtcctg 
220 

tacaggcata 
260 

tatgcagagc 
340 

agacggaaga 
400 



ccaggcggga 
50 

accatccccc 
110 

ggctaatttt 

170 

atctcctcac 
230 

agccaccgcg 
290 

aaaagagacg 

350 

tgagg^caga 
410 



acaaaaatat 
490 

taccccagtg 
550 

ccaatcttac 
610 

cccccacaga 
670 

aataaatctt 
730 

cttagccacg 
790 

tcttgatgcc 
850 



tagagggtag 
440 

tcagtgtgat 
500 

agtaattttt 
560 

tatctttcta 
620 

aacaaggcaa 
680 

ctagttttct 
740 

ggccaacggg 
600 



gcgcagcggc 
60 

tgcctcagcc 
120 

twgcattctc 
180 

cccgtcaccc 
240 

cccggccgca 
300 

ccaacgatca 
360 

aaaggaggaa 
420 



ccataagaaa 
450 

ttacccctaa 
510 

cctgtgagac 
570 

tacatttccg 
630 

gaaggaaaaa 
690 

taaagaccct 
750 

ttgctgtcac 
810 



ataacacaga 
460 

atcaactaac 
520 

tcaaagactc 
580 

aatgaccaag 
640 

aacttccaca 
700 

ggtttccggt 
760 

tgaaaaggac 
820 



cttgttacac 
470 

Ctgatgtcaa 

530 

actgaagatt 
590 

agagctcgta 
650 

cgtagaatta 
710 

ataaagaaat 
770 

gggaaacagg 
830 



gtaatgattt 
860 



gacatcaccc 
480 

aaagtaaatg 
540 

cactgcgacc 
600 

acaattattt 
660 

caaacggaaa 

720 

gtcccagctt 
780 

aacccaccac 
840 



ctttcctggc 
910 

gttagaaaca 
970 

aaaattaagc 
1030 

taatcaagga 
1090 

cccaaaaaca 
1150 

agagcccaac 
1210 

ctcciaggcc 
1270 

gcgatccgtg 
1330 



aagctcggaa 
920 

tatctttcta 
980 

t taatgatag 
1040 

ctgcaagcca 
1100 

agttctaaca 
1160 

^gccaaacgg 
1220 

cctaatctca 
1280 



gttcaggaca 
870 

aatatataat 
930 

taggtattac 
990 

gatatagtaa 
1050 

gagaccagac 
1110 

gcacacgggg 
1170 

tttaaagaaa 
1230 

tcttcantcc 
1290 



tcacgtatac 
880 

aacctaggga 
940 

ataatgatca 
1000 

taaatagcct 
1060 

aaacacaagt 
1120 

tctccgagca 
1180 

gacacgttta 
1240 



cccaacctgc 
890 

cttacatgca 
950 

ttctcagacc 
1010 

cataagtccL 
1070 

tcctgtggag 
1130 

cagttacatt 
1190 

cttatgttat 

2250 



acaatttgca 
1300 



tgtgggtaca 
1340 



gaaegtggca 
1390 

CttCCZ tgcc 
K50 

atgcccatag 
1510 



Aaccccaaat 
1400 

acaggaacac 
1460 

gccgaggaaa 
1520 



cacatgggcg 
1350 

aaatacaata 
1410 

aatccdctca 
l-;70 

attaaagagt 
1530 



tgtgtatagc 
1350 

tacatggagg 
1420 

aagatarcag 
1480 

^aaggttcag 
1540 



aataaacitt 
1310 

agcatacrtc 
1370 

cttcccccca 
1430 

agtctccatg 
l-i9C 

gaggaatata 

.550 



caacggattc 
900 

aacaccaaga 
960 

tcaaaagaaa 
1020 

tatgttaaaa 
1080 

aagcgcggga 
1140 

aaaaaaaagc 

1200 

ttazaggaga 
1260 

ageaatccca 
1320 

aLcacca^cc 
1380 

:.crccctc 
1440 

rctagg-acg 
1500 

ag&iraaaac 
1560 
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fFagmeiTt3:FM0y 



aac„,ca,c acacccaac, «.a.,a,ca .,„acca,a acacc.„cc 
ccaa«ca« a.ccac.a, «cc.acca c.aaccccc .=c.=..cc 
cctaaaaca, 5.ac..ta,c ccaccac.ca .99ac,tca. =aa,a..aaa "."aaaac 
,c.aaa,ca ^^^^^^^^^'^^^ 

accaccacc, caaca.aca. c«cac,ccc .aa,a.cc.. .aa,,aac.a aaa,caa,c. 
cca,„„c. .ac,.caaa aaac.c.aaa .„a.aaa., .c.^aac. a,„aa«c. 

"""t»o '""'fits 

1360 1970 1990 

'"""ss? ""'"5f; """iss '—«iss """sss 

=..cc5j„ 

"""S!S "'-IKS """I- •-.-;n «.c«;;|j 

"*""lJn """ISS "*"%•!!? ""-SSJ 
"5S ""-nj; """ills — "c„„„, 

"""i;;; """Si; """;f;; ~'"«||| "«"||» ""«||J5 

c„c„..„ ^,,^^^^"1° 

"'"'ins "-'SJ- „„„„„ 

"'"'SIS """SJi; '""Msg -'""ii;; 

—in; -'""s;; '"...-s .c„„„„ 

""""»" '"""K; •"'"ii;s """SIS """IJ5S """I- 

—■'ins """ISi; """ti;; 

"""'1"; """i;!; -""sjs -""-iss "—i-s 

""""" ""'"I'll """!;?S """ISSS """is; """uis 
•'""S;;s -'"in; -"=i;ii — 

"""ISSS — 'tiss """li;; 

— "ISiS "-'f-S """ISIS =".«5«; ....c„... 

'•■""is;; """ISIS """isi; "-"i;?; ."..-IS «c..,.cjj 

'""=i5is '""'n;-i "'"'lis; "-'-ffis "««.";• 



2120 
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fragmentS.FMOx Paae3~ 



*"-SJS "-"'ss; -"'^jj 

"""3?S '"-sss; — -...c^... 
c«c.,„„ — ^^^^^^^^^^ ^^^^^^^^^-^ 

'"""KS """HIS """KJS """ffiS '"'"HIS 

""">'5;j '-"fsjs """;ss "."-3,^. 

cc„„;„. „„„„„ ^^^^^^^^^^^^ 

««.C.J,J .„,..„,, „„.,„.^^ 

"""SS?S -"SS'i; «"=c.«5 

'"'"SIS """SS """!fJS """ffSS """;||; 
""""" """SSfS 

"'"'5"s """!;n "'"ins """sns 

""""" """"55 """SfS '"'";i;s — "5IS; 

"""?nS """|«. 

"""3"" '""'lire "—sjs =""';iis 
"'"•;;is ""«js;s — ;sis ..««.c„ o„...„„ „„„„„ 

"""JtSS .,..„.„, 

""""" """JJis -""ss """iiii """=5;; """nil 

"'""Its """.'as '"'"s;s """s;!; 
"""sss; —■-jsi .,.„„„, 

'"""i;S ""-ni; —"-1; """»;; 

-"Sfi; ; 
•-""ISi; c...==c„. 

"""?I?S """tit; "«";-|;s 

"" .......J. 

'"'"ni; ""-;i;; '"''=hk — "ss -=":-|ts 
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fragmenta.FMOx 



ca.,cc.c., c«„a,,aa ,cc.ca.«c aaaa,c,cac acc.ccccca 
,..,aca..c c.,=a,aacc acca„a„c a.„aacac. caaa^.aa., 
ac.aa=,.„ c«,.aa,ac ca,cca,acc cac.ca.cca cc.cc.c.ca 
ccaacac..a c.aa.a„a a^cca.cca „.a,aa,aa .ca,cacacc 

.a^ccaaaaa ,«tca«gc ,.„a,a,aa a,.c„caa, aaaa.„a„ 
caaaa,a,c. aac,cca,ac „a„a,cca aac.,.ca,. ccaaa^cacc 



«aacacc,c „c«,cc., aca,ca,a,, 

accacca,, .a«a.,c« accaccca,, c,acaaaa. a.c.a.acac 
.,.cac.caa «.ac..a.a .aacaaacca .„a=cccca aacc.aaa. 

"I? """t5ig — f- —ins """nio^ 

—II- """ins —llfS -caa^^aaaa 

"""ins -""'IJIS —IISS — f^?S 
— IIJ? — tslo """III? ^'-«||?S 



cccccgaaac 
4740 

4600 

ga^acaggqc 
4860 

aacagaaaaa 
4920 

tggcccatgc 
4980 

aaccgtaaac 
5040 

tacactacca 
5100 



""""" """mi """ijf; '—ni; —"iiss 
""•'i.'s ""-"sns '""'iss """is; """aj. 

"""ir,i """sss 

"'"""S """IKS """ISS "•"•fSi; """||,'5 

"""HI? """isss """s;? """iiis 

"""""" """SIS "'""HS --—ss 
"■"-ISf; """i5;s "-'-s 



aaaattatQt 
5160 

agaaaaaaac 
5220 

caaacccctg 
5280 

aaaagttttt 
5340 

cctcatcccg 
5400 

catagtttca 
5460 

caccccaagt 
5520 

tctgccacct 
5580 



^aagcacaga 
5640 

aaatcccgga 
5700 

tatitcccaga 
5760 

acagccgatg 
5820 

tctccatgta 
5860 

gcatgtgcca 
5940 

aacctatga^ 
6000 



"""IKS .«cc=„5, „„„„„ 

"""m '--"g;; .."--ijjs -.,«=c.. 



aagcaacaac 
6060 

tggcgitctt 
6120 

£180 
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fragrnent3,FMOx 



6250 

6310 

gtgtggcacw 
6370 

cgaggacggg 
6430 

cccctacccc 
6490 

caaaggcatc 
6550 

gcccct tgga 
6610 

cgcaagcagg 
6670 

ccgct&tacg 
6730 

acctctcaag 
6790 



caggtatttc 
6260 

cccccgagaa 
6320 

ctgtccatca 
6380 

accatgtttg 
6440 

ccccccgacg 
6500 

CLccccccac 
6560 

gctgccaccc 
6620 

tgggccactc 
6680 

caaagcactg 
6740 

gcctaaaatg 
6800 



ttggaaatga 
6270 

aagagcccgc 
6330 

agcccagcgc 
6390 

aggctatcga 
6450 

agaccatcat 
6510 

taatggagaa 
6570 

ccacagcaga 
6630 

tgtccttcat 
6690 

tgctagggat 
6750 



gctatttaca 
6280 

gttcaacgac 
6340 

gaaggagttc 
6400 

ctctgtcacc 
6460 

gaaaagcaga 
6520 

gccaaccctg 
6380 

cccgcaagcc 
6640 

ccattttatc 
6700 

acaatgagaa 
6760 



cccagtgagg 

6850 

gagggaaagc 
6910 

agaggcaggg 
6970 

catagggact 
7030 

aatgccaggc 
7090 

aaccccactg 
7150 

caatcttctt 
7210 

cttatgtgag 
7270 

ttaa&ttact 
7330 

ggtattctcc 
7390 

aaacttacac 
7450 

waaaact: 
7510 



ggagttggac 
6860 

atgaaatgcg 
6920 

«9tggcaaga 
6980 

aaggacttcg 
7040 

tacattataa 
7100 

gtgccaactc 
7160 

cttctctccc 
7220 

gaaatcaaga 
7280 

ccagtcatac 
7340 

aaaacattga 
7400 

taccggtaat 
7460 

ccgLagacaa 
7520 



g99tgtgggg 
6810 

tgttgcacag 
6870 

taaggaccca 
6930 

aatataggtc 
6990 

caagatctta 
7050 

agac tggaag 
7110 

ctgccagaac 
7170 

tccactctag 
7230 

atatgaggac 
7290 

tgaatattac 
7350 

ccaatacagg 
7410 

taacaaacca 
7470 

ataaatttct 
7530 



gacgccataa 
6820 

agcaaacagt 
6880 

gaaacatttt 
6940 

tataagccac 
7000 

agcaagaaaa 
7060 

ggccctggtg 
7120 

aacaaagtca 
7180 

acctcatggt 
7240 

cacatggaga 
7300 

cacLatcatc 
7360 

tacaacttac 
7420 



gcaagggtgt 
6290 

gagcccccac 
6350 

acggaaacct 

6410 

tttgcaacag 
6470 

aacaatgagg 
6530 

gctgcgactg 
6590 

tggtgggctg 
6650 

aacgaacact 
6710 

caagacaaac 

6770 

taggggaaat 
6830 

atacaggaag 
6690 



ttgcctctca 
6300 

cccgcatcct 
6360 

cagctgtgcc 
6420 

gctatgatta 
6480 

ttaccttgct 
6540 

gcttggttca 
6600 

ccaaagcatc 
6660 

taccgaacac 
6720 

atgtcccttg 
6780 

ttgggggggt 
6840 

ccataaaggc 
6900 



99t9gaaggg 
6950 

gttaaagagc 
7010 

aaatagcaga 
7070 

a999ttggag 
7130 

ggccaccccg 
7190 

ctccaggggc 
7250 

aaggcaaLgt 
7310 

gaaaagcgtt 
7370 

ccaacacaac 
7430 



icacaaicat 

7480 

icttcaaata 
7540 



iaaai.aaacc 
7570 

CLttCICCtC 

7630 

atagttcata 
7690 

atacttactg 
7750 



ccaccacgaa 
7580 

cgaaaggcac 
7640 

aacctaagaa 
7700 

aacacctact 
7760 



atccLctgta 
7590 

aacaacgcca 
7650 

at tcacarga 

7710 

atgtgtcagg 
7770 



aaggcgctcc 
7600 

agagcccggg 
7660 

agcaaatggt 
7720 

ctccaacctg 
7760 



ggaatataig 
7490 

caccacgaaa 
7550 

ctgcaaaata 
7610 

gcattatgag 
7670 

atcaitcari 
7730 

gcacttat;ga 

7790 



aatataaagc 
6960 

ttaaactcct 
7020 

ggacaaccgc 
7080 

gcgtgccaga 
7140 

attctcatga 
7200 

tacaagcacg 
7260 

cccdaatata 
7320 

cttttatcca 
7380 

taatccataa 

7440 

tatatatatt 
7500 

gaicatcatt 
7560 

CCicicttgc 
7620 

aegaciggac 
7680 

7740 

cacaacaaca 
7800 
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'-"nit '""'Sis; "'"-il """is; 
c..c=.„jj .c=..c,.„ .o.„„„5 

""•"S- .c„„.o„ 

"••"?;;s '""%';;.' """;;;; — 

""";s;s "'«'S;is "-'•;?;; ""•■;;;; ""«|- 

""""" "'"'S"S """in; *"'";;;; -""ifi; ««"j;j; 

'"""?;; """;;;? — ;;i; """nii """si;; """j- 
""""" """Sns """SSS '""';?;; '"-si;; — -i- 

'""'tnt ""'=s!fs '"'"ssi; ""-;ns "«";n; 
""""ss —"sjss -"-ssis —"s:;; 

,o.c„5j5. 

•-";;;; """ssss """is; .."..n;. 

""■%'l;; """IIJ5 — ;||; 

'"•"SIS """1115 '"-||;s 

"""till —ttll """IKS """;;:; —isis -"-i;;; 

"""i^t """!;;; ""«s;; "■="':;;i '""•;;;; 
'""•s;;; """i;i; "-"-j 

'"'"SIS "'"';i;| """.si; 

'"'■"SISS ""'« •""•SSS; """i;;s "'-n;; 

""'1l;S """Si;; «tc..5..j 

""";;?; """;ii; ««.,,5.; 

"""Hi; """|;|; 

„„„„„ 

"5s "'"";S5 -"-"KS """Ills """Iff; ;i:; 

'""'IliS ="=";!S; "="v- """SISS """lis '-'-s; 




BNSDOCID: <FR 2756B45A1_L> 



2756845 

44/53 
Figure 10 (suite) 



fragmentS.FMOx , , , . pagez, 



taggtgacag agtgagactc catcccacaa aaaaaaaaaa aaaaa 
5370 9380 9390 9400 
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fragment4.FMOx . .... .. p.^..,. 



aaaaaa.a.. aaaaaaaaa, =cacaaa„c caccta.taa taa„a,cag aa,.,a,cac 
caa,acca„ ca„aann.a caa.ccaacc -t^tt.t^c ,caaac,cag ^cagactJt 
.ac=a„acg .cccc.accc a.,aa,cjac ccccccaaac c...aa„'!a aaa,a..aaj 
acca,c=cc= .acccccc,, ctacacaa,a ccccttt.c. ,,atca,c.c ...caac^cc 

"'""1o c«.cc.a., »c.«cl° 

a«,acaatg cccctg.cc. cccagaaccc c.e,a,ctca acat„aa„ cacc,.a,ta 

,c«aacc.c ccccaaacac aacac.c.aa .cca,c«cc a^aeca^^a ^ca.aa^ 

cccccaa,,c tca.caca.a ccacacccca .„aaaa,a. a,ccaac,cc ,c„aa,aca 

acccaaca,a 9a,aacacca t„aa,ccj, ,aa,9.ttat acca.tgaa, at,ccctaat 

520 530 540 

..«a.a,aa aaa,ccaC|a aa^cca.caa .cccaaaaca aca.a«.« c«„a,aaa 

accac,.cca ,ac,ccacac ac,acccca, .„a.«aca aca,acca,. caca.aaacc 

«,aaaaa,a "at^gacat ..caaaataa aaa„t,a,g ,.,aa,„« cca.,aca., 

/uo 710 720 

9accat„a, "attc.aca ,cca.ta,ac -cactaata ,acact«c. accccacac. 

750 760 770 780 

a,a„aa«a aa.,ac,acc ..a.„a,a. ,a,.ccccc= aaa,ca,c,c ca,a.,a,a. 

Caa^acata ,aaaaa,cca .,cca,aaa. aaacc.acac .a,accacct ,,c.JZ 

° " 880 890 900 

""""" ""'*%%'! '"""i:; "■"•%- 

"'"■'.•n """ss; 
"""tin "'-nit — .=.«..s« 

,=ct„c;jj „„„cjc; .„„.„jc »o.„cctj; 

"""SIS """!;;s ""-MIS 

""-n;.' """fsi; ""-"tin '"^^vai -"'"nn 

1240 1230 1260 

a.aa....cc .aacaaca.c .ccc.ccc.c caca.-.accc .a..,-.aa,a 
-^^'w 1300 1310 1320 

a.a,....ca a.ac,.ac,a ca.acaaaat a.,.,.caac caac...c-, =a.ca.=„. 

*3e0 1370 1330 

"'""S; """SIS '""•?;?; """lill """fSfs 

""-s'iK --"ins --=";if5 "--ssi "--Li° —fiss 

"""•"g """rSIS """tfjg ---15 



46/53 
Figure 10 (suite) 



2756845 



fragment4.FMOx . ...^ Paae,2> 



"'"""S ^'-'-ttlS ^""'HIS 

cc,ca.cc=. „a,c.ca,a ,ccaaacc,c ccc,aa»tg ca«cc,.c. ,ca,ca,.„ 
=aa,.a„.. „.„aa,,a aacacaaaa, a,ccaac..c caa,.....e accaa^aac. 
cacaccaaaa .ca.acaa,c cacc,a.c„ c.a.acac.g «cc.c,.a. cacaaac.cc 
ac,aacac,a a,ac,ac,a, c,a,aca,cc a,cca„aac aaaaacjccc cc.aacaa.. 
,cc,c=a„c cc„caja„ ,ca,=a.,ac aa,.ccc«a cac,c„c.= .«ca,c.., 
""-tcac aca,c,=aaa c.ac.c.,a, ccac.cccc. cc.c.cacac 
"'-*|-a ccca.cca„ ,ccca,agaa „aaa,aaac „aac=ccca 
.acccaacaa aacccc.cc. ,c.caac.cc a,cca,cc,a c,aacaa„. ,ca,a,..,, 
,cac«.ca. ,c,ccaacaa c.cac,ca.c c.,acacc« »cc«.a,a ,=c=a,.a,a 
-acaaaaac, a„aaa.a,a ,a,,ctaaaa .,«cat«. a«,=c.aaa c,acaa,cc, 
cccccca^ag «.caaaaa, caaac.acac c.ac.ccaa ct.aaa,aac c.ca,.„c, 
,a..„a„. ,a.«ccccc «cccc,cca .aaa.„... .„ccaacac ccc.acaaca 
.aa,aca,.c .aacaa,a,a aaac,c,aca ,a«.a..ac ,.,cacac,. ,c,cac,a,a 
^ccccacaaa acac.aac.c aaa,,a,„c ca,accaccc a.,.ccaaa. a.cc.cctca 
cc„„..a, „,a,a.„a a,c,caaaa, .aaac,accc C.ca,a,.aa a..aa.aa,c 
ccaaa,aaca =a,a«.,ac caa,.c.c.c .„,cc.c„ „,a„c.ca a.cacccaac 

f,%=s "^"'"tt?? ''"-fill nt! '""'Ills 

— ""-||,'S ''*'"=t,%%' '-«-|tis 

.,aa.a„„ „,„„aaa c,a„cc,a, accca«a„ cc,ca..cc= a„a„cca, 
,ca.cc..a, ccaca^a., a,aaaa,a„ cca.cacaa, a..ca„cca caaa,acc., 
,=.,a.aaaa ca.,a..ca, .aac,aa,« „ccaaaacc caccaaaacc aa,a=,a.,a 
.aaaa,.„c cc.a.ac. ca.aca.^c .,a.a.aa. .aa.a.ca. 

.= ca,aa,ac ac.ccca.ca ,=ac...,a. a,..acaaa .,=ca.,.ca ..a.ca„aa 
.= .a=cc.ac a.a..c-.aaa aa„„a..a accc-.ca,.. c.„,aa=., =„a..-.c.. 
.cc.,.aaaa c..a..aa.a a.ccacccc. .....aacg. ,.aa.cea,a a..aac.a.a 
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tragment4.FMOx ^s^^. 



"""3"o '"-'ftlS — 

"""fIfS """fL'? 

«a,*,|ccc "^"ccctc «ct„„tc t„cca,cta aacg,a.„a ca^a^ccca 
•"^^O 3270 3280 3290 3300 

ttactactca ««",cccc catgaaaau ca,a„cca, atttttttaa ,5ata,tct, 

3360 



3320 3330 3340 3350 

.cca,„aa. „„aac,« ,acc„cc,, ,.ca,„a., aaaccaca„ 

,a,ccaaa,c «,cccc«, ,.«ccct„ ,a„a,acca cat,acaa,a c,aacca,cc 

taccagtctg 59tagt9cca gccggcccat cagaatgcag ggtccgaaaa acatcttgag 
3490 3500 3510 3520 3530 3540 

caccaatgg. agg.«ca.a acgg.ga.gc c.cca.agg agcaaccggg gac«„ga= 
cgcacgacjc c.gagcccca accccc.acc «gc„«aa cccgccagtc ccacaaaagc 
agc«ga.cc ccaa,caa„ ag„,g..., 

.caaagccaa accgcaaac. aaa.gcc.cc catage.agc ccggccca.g c.caggaac, 

-acaacggca gcccggagac cagaagaaag atggagcaa. .aca«cc« c«caca.« 

tc«cac.g. cacaatc«. ..aa.ggtga cc.cagaggj a.ca.cacag gac.gggag 

actaaaggga ggaaagtatg tcaaacaaag gctgtcctgt tctgcagac, aaacctcaca 
3920 3930 3940 3950 3960 

,«ag=aac. c.cagag.ca g.agcccacg acgaaagccc ccc.gccaga cacccagcag 

.gcccgaccc .cag.c.c.c cc.cc.gcaa g..aa.«« cc.agagcgg gcaagggag, 

ccccagaa agcceagj.c cca.c.ecjg cc.accccc. cc.a«e.c. ccacagacaa 

aaacccccc. cacaaaaggc agc.«.=ag ggc.g.c.c. g.c.gcaggc c«cc,a„a 

gccatctcaa "tctgccaa c^aagtgtat accttgcagt aaaatatttt ttgttttctt 
4220 4230 «240 4250 4260 

tagcacgaaa "atttatat "tcagacta caggagtatt aaaaccatcc atgatctcac 
4^70 4280 4290 43OO 4310 4320 

c=..aaacaa accaacc.ga aag.c.aaca ..ggggcaga ccccaagcaa cg.ccca.aa 

aga..aa..a ...gc.aatg agcaaac.aa ...aaccagc cccc.aaac cagagggcca 

5-. = cacLcca ggccacatgg tcaaaggcaa aagcccaaca ctacaccaaa ctcaaataca 
"^SO *<'0 4480 4490 4500 

gactaggaag caggagaaaa gcagctcact tagctaaaga aaaaaca.ta aa.tcaa.ct 
4520 4330 4540 4550 4560 

=gcggaaaag e*S55cataa atggagg.gc -.acctaaaat gttatttrtc cgaaagaaaa 
"^580 4590 4600 4610 4620 

aataagaaat -atcctcc^ atttgcaacc gtaacactta ttccagtarg t-.ctc-.-.=tt 
4630 ^4640 4650 4660 4670 <650 
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tcttcatgtt 
4690 

tgg^ctcttt 
4750 

cqgccccgga 
4810 

ggaagcggga 
4870 

ccaggacaag 
4930 

cgcttccact 
4990 

CCtgaggtct 
5050 



tggccagagc cagaccccgc 
4700 4710 

cacaggggcc aagcctaaca 
4760 4770 

ggtgcactct ggcccttgca 
4820 4830 

cggggccaga aatgccatcc 
4880 4890 

agttgtcagt gaagctcagc 
4940 4950 

cccattaccc ctcctggctg 
5000 5010 

caaaattcag catagaagtg 
5060 5070 



agacagatca 
4720 

caccacggcc 
4780 

gcccacacca 
4840 

tgacccagtg 
4900 

gaccccaccc 
4960 

ttacacccac 
5020 

taatcacaca 
5080 



caccacdwac 
4730 

cttcccgaca 
4790 

gttccgactg 
4850 

gaaccggaca 
4910 

cctLcacaac 
4970 

attttatcaa 
S030 

acacaacaca 

5090 



acacacacac 
5110 

tggcccattt 
5170 

gggaacctgt 
5230 

gacaagacag 
5290 

aaaC9taaag 
5350 

aaccgaagcc 
5410 

aagataaaat 

5470 



aaccacaaca tagttcctcc 
5120 5130 

gaattaaagc ataagcaaaa 
5180 5190 

tccctaaaag gcttttcaca 
5240 5250 

gaagttgaat aagcatgagc 
5300 5310 

gcattttatt ttgtccatta 
5360 5370 

attgacatta aatcaacata 
5420 5430 

gaacacattg cttgaaagat 
5480 5490 



ctcctttcct 
5140 

tggaaaacac 
5200 

tgctgaactg 
5260 

acagattttc 
5320 

tagtatatta 
53S0 

gagagataag 
5440 

acatactgcc 
5500 



gaagatacga 
5150 

tcagcctctc 
5210 

gcaaatttgg 
5270 

aggccgaaca 
5330 

accaat9tac 
5390 

tttataccaa 
5450 



gtggatgagc 
4740 

gacccccgcc 

4800 

S^^ggaccag 
4860 

gtgaagccaa 
4920 

ccgcccaaaa 
4980 

tgagaaagtc 
5040 

caccacacat 
5100 

aaatcagtct 
5160 

tccccccgct 
5220 

ggatgcttaa 
5280 

aagcccaaca 
5340 

tttccatacc 
54 00 

tacaacaacg 
5460 



aaagctcccc 
5510 



cacataacct 
5530 

tccacaaaga 
5590 

aagcaacata 
5650 

cagctcatca 
5710 

gatcaatatc 
5770 

cagttcataa 
5830 

taacagtcaa 
5890 

caataga^gc 
5950 

acaaagcgat 
6010 



gaatagatct aaatctatta 
5540 5550 

acaggccaag aaccaggtcc 
5600 5610 

ccaactatat gcaaaatttt 
5660 5670 

tagccctgac acctaaacaa 
5720 5730 

cttcatgaag atatatgcaa 
5780 5790 

aatgaatagc ataaccaagt 
5840 5850 

tgtaattcac cacatttgta 
5900 5910 

ataaaaagca tccgacaaaa 
5960 5970 

agaaggaaac ttccccaaca 
6020 6030 



aagtactcga 
5560 

tcactggcta 
5620 

ccagaagact 
5680 

gacaaacaca 
5740 

aaattcttaa 
5800 

aagaattatt 

5860 

aactaaaaat 
5920 

gccaacaccc 
5980 

tgaaaaaggg 
6040 



attcgtagtt 
5570 

accccgccaa 
5630 



ctaataccat 
6070 

aaaggccttg 
6130 

taaggaaaaa 
6190 



actgaatggt ggaaaactaa 
6080 6090 

gcictcacca cttcractca 
6140 ei50 



acgctgcatt 
6100 

acatcctact 
6160 



aaagaggaca 
5690 

ttctaaaaaa 
5750 

caaatgtcaa 
5810 

ccggaaaagc 
5370 

gaaaaaccat 

5930 

atLcccgaag 
5990 

catciaccaa 
6050 

Lctaagagca 
6110 

ggggirrcra 
6170 



caagaagaag 
5520 

caaaaacLcc 
5580 

acatctgaga 
5640 

gaataatccc 
5700 

acaaaataca 
5760 

cataatcaaa 
5820 

aatgttggtt 
5880 

aggatcacct 
5940 

aaaacictLca 
6000 

aaacciacag 
6060 

ggaacaatat 
£120 

^ccactgcaa 
6180 
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fragmenM.FMOx 



tttattctta 
6250 

acagaacaaa 
6310 

taaaccacca 
6370 

99taaaaacc 
6430 

aatg9a9aga 
6490 

ctcaagt tga 
6550 



gacaacataa 
6260 

taattatatt 
6320 

tttacaacat 
6380 

atacaccgaa 
64 4 0 

tacaccacat 
6500 

tccataattt 
6560 



ttgtctatac 
6270 

tccacdCact 
6330 

ccaaaaatat 
6390 

agctaaaaaa 
6450 

cctgggttga 
6510 

caatgcaata 
6570 



agaaatcatt 
6280 

aaca9t:aaac 
6340 

gaaacattta 
6400 

cacagctgag 
6460 

accaccgata 
6520 

ccaatcaacc 
6580 



gaaattgaaa 
6610 

acaaccc tga 
6670 

tgaggcaggc 
6730 

ccccatctcc 
6790 

gctacccggg 
6850 

tgtgccattg 
6910 



ttgaaaccia 
6290 

agtagaaaac 
6350 

ggataagcca 
6410 

agtaatcaaa 

6470 

ttgtggtgat 
6530 

ccctaacatg 
6590 



actgattcta 
6620 

aaaggccggg 
6680 

ggatcacctg 
6740 

accaaaaata 
6800 

aggctgagac 
6860 

cactccagtc 
6920 



aaatgtataa 
6630 

cacaaaggcc 

6690 

aggccaggag 
6750 

caaaattagc 
6810 

aggagaatcg 
6870 

tgggcaacaa 
6930 



aatgtggagc 
6970 

cagcaatcaa 
7030 

gaatgtctgg 
7090 

gagccttttc 

7150" 

ccttcagtca 
7210 



ggtatttaaa 
6640 

cacgccagta 
6700 

ttcgagacca 
6760 

cagacgcggt 
6820 

Ctcgaggcgg 
6880 

gagccaaact 
6940 



ggacccagaa 
6650 

atcccagcat 
6710 

gcctggccaa 
6770 



cataaaaact 
6300 

tagaaaatcg 
6360 

gcataagaaa 
6420 

ggcctaaata 
6480 

9tcaatcatc 
6540 

cccttttata 
6600 

ccgitaaaaa 
6660 

ttcgggaagc 
6720 

cacggagaaa 
6780 



ggtgcatgcc 
6930 



aggttgcagc 
6890 



ccatcccaaa 
6950 



attaacacta 
6960 

gtcagtatgc 
7040 

aaatagaacc 
7100 

aacaaatgat 
7160 

atactttgta 
7220 



aaccccaaaa 
7270 

tagatacaat 
7330 

aaat^aagaa 

7390 

atggacacag 
7450 

agggatagca 
7510 

gcatgacaca 

7570 

caaagcataa 
7630 



cttccagcag 
7280 

actaaatgca 
7340 

cagttctagc 
7400 

gaaggggaat 
7460 

ttgggagata 
7520 

tgtatacata 
7580 

waaaaaaaaa 
7640 



cctgacttct 
6990 

tatggtgtga 
7050 

acacaatatg 
7110 

gttggaacca 
7170 

ccatacacaa 
7230 

aaaatgaaaa 

7290 

caatatccat 
7350 



gattccagaa 
7000 

agacaaacaa 
7060 

gacaaaggtg 

7120 

tcggatatca 
7180 

aaagcaac tg 
7240 

agaaaatctt 
7300 



tttcccatcc 
7010 

taggtcaata 
7070 

aaaatccagt 
7130 

cgcaacatgg 
7190 



aaagaggacc 
7250 

tgggttaggc 
7310 



ctttaaaatc 
7360 



9tgtaaatcg 
7370 



tgtaatccca 
6840 

gagccgagat 
6900 

agaaaaaaca 
6960 

catgaagcta 
7020 

aaaaagaacg 
7080 

aaagacagga 
7140 

aaaaaaaaaa 
7200 

atagaactaa 
7260 

aaaaatgtct 

7320 

aacttcatca 
7380 



atattctcac 
7410 

atcacactct 

7470 

tacccaatgc 
7530 

tgcaacraac 
7590 

gaacag;cct 
7550 



acactgatac 
7690 

actcaatttg 
7750 



-tatgacatc 
7700 

7760 



cacattarrt 
7710 

gegatg^aca 
^770 



tcacaggtgg 
7420 

ygggaccgtt 

7480 

"aaatgacga 
7540 

ccgcataatg 
7600 

aacatccctt 
7660 

grace caata 
7720 



gaatcgaaca 
7430 

gtggggragg 
7490 

gtcagtggcg 
7550 

tgcacatgca 
7510 

caggaaagaa 
7670 

aaagcaggat 
7730 



agrcatagta 
7780 



gaaaaagrrc 
"790 



atgagatcac 
7440 

5Scagggtgg 
7500 

cagcgcacca 
7560 

ccccaaaact 
7620 

tacagtaagt 
7580 

gaa^artctg 
7740 

agacicgaaa 
7800 



Pages 
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Pagers*' 



7610 

aatcaaaacc 
7870 

cacacacac? 
7930 

tctgcaagaa 
7990 

ttcaatccgg 

eoso 

gaacaagaaa 
6110 

agaaccccat 

8170 

agtgaaagct 
6230 

gaaacctttc 
8290 

ttgcactaaa 
8350 



ataccaaacc 
7820 

ggctcaaacc 
7880 

ctagcgttgt 
7940 

CLataagccg 
8000 

ggaccaccaa 
8060 

aataacactc 
8120 

tccctcctca 
8180 

ggctaaatgg 
8240 

tgtaattcag 
8300 

c taaacctga 
8360 



accccaatcc 
7830 

agacgcgccc 
7890 

gtt:gtgccca 
7950 

aLtcciccaaa 
8010 

cgaagaccaa 
8070 

tgagtggggg 
8130 

gacctagtac 
8190 

accgctgagc 
8250 

acttcctgat 
8310 

tggaatgttg 
8370 



gccttcagaa 
7840 

ccaaagcact 
7900 

gtatgacgct 
7960 

tatcctatgc 
8020 

tccggaatcc 
6080 

tctcttttct 
6140 

tagagggacq 
8200 

ccttcagact 
8260 

attttactca 
8320 



tatgcataat 
7850 

cttgtgtaca 
7510 

agattgtgca 
7970 

acacattcct 
8030 

tggagagaga 
8090 

ggaacatgcc 
8150 

tcctccccaa 
6210 

cagcttac^t 
8270 

atcacatgga 
8330 



ag taagtaga 
8410 

agaacaaaga 
8470 

tcatgcacct 
8530 

catacacaac 
8590 

ctaaccaaac 
8650 

ccaacagcaa 
8710 

accacatcct 
8770 

aaaaagggtt 
8830 

caaagatcgc 
8890 

ctacaaaaaa 
8950 

ccaaatctca 
9010 



cataagcgtg 
8420 

gccgtcaagg 
6460 

cattccactg 
8540 

ctgtaattga 
6600 

aaaacccttt 
6660 

accccacagt 
8720 

taatgtttta 
8780 

aagagtagta 
8840 

tcaagcacag 
6900 

attaaeatca 
8960 

cgttgaaacg 
9020 



gtccttccca 
8430 

agtgacaaaa 
8490 

attgggtagc 
8550 

atctagtgta 

8610 

taccagctga 
8670 

taagaaacta 
6730 

ctttgcctct 
8790 

gcttatgcct 
6850 

gagcccgaga 
8910 

aaaaattagc 
8970 

cgatccccag 
9030 



cttataacct 
8380 

tcatctttac 
8440 

ggcgagggag 
8500 

ctgctcatct 
8560 

aggactacac 
8620 

ttcccaaaga 
6680 

ctacgcctcg 
8740 

aaaatcctag 
8800 

ggaaccccag 
8660 

ccagcctaag 
8920 

caggtgctat 
8980 



ctgcgtactt 
3390 

caaccatgca 
8450 



catgccaacL 
6510 

gtgaaaccca 
8570 

cagacaaacc 
6630 

caaccagccc 
8690 

catcaccaga 
8750 

cacaaactag 
8810 

caccccagga 
8870 

caacacagca 
8930 

gac tcagacg 
8990 



Ctatcctagc 
7860 

tgtgtatgtg 
7920 

acagaaagag 
7980 

gagtcccctg 
8040 

cacctgggaa 
8100 

tcagggtgtg 
8160 

caaagaccgc 
6220 

gagccaacta 
6280 

taacattaac 
8340 

ggtcctgtgt 
8400 

aaacaaagtg 
8460 

caaagctaac 
8520 

tgtttgcgtg 
8580 

caLtaacaaa 
8640 

cccagccaga 
8700 



tgtcggaagt 
9 04 0 



9050 



rcictcataa 
9070 

tcacgagagc 
9130 

caattctcgi 
9190 

cgatngcaag 
9250 

gccigcagaa 
9310 



aLggcczggt 
9080 

tattaLagtt 
9140 

gctcccrt tc 
9200 

ca-ctrcagg 
9260 

:gaLgaacca 
9320 



gccctcccca 


gggtaatgag 


tgag^rczcs 


9090 


9100 


9110 


gctcaaaaga 


gactggcacc 




9150 


9160 


5170 


acaccaigtg 


acacgcc wgc 


tccccctzca 


9210 


9220 


9230 


cctcaccaga 


aacagacgtc 


ggcaccacgc 


9270 


9280 


5290 


aaataaacct 


ctrticttta 


caaatraccc 


9230 


9340 


9350 



cacagaagaa 
8760 

catattttta 
8820 

ggcccaggca 
8660 

aaaccctgtc 
3940 

tgtgtcccct 
9000 

gggaagcgac 
9060 

ctctatcagc 
9120 



9180 

cczzczgcca 
S240 

ttcitg-act 
S300 

agccccaggi 
5360 
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atttccctac 
9370 

9430 

C9C9tta9ca 
9490 

cggqaggaac 
9550 

gggca5ctac 
9610 

agccccccca 
9670 

atcgacaatt 
9730 

gtacttgaag 
9790 

gaaacccaag 
9850 

tcccacatcg 
9910 



agcaacacaa 
9380 

ccaacataac 
9440 

aggaaaagag 
9500 

acagggtccc 
9560 

acagaccaaa 
9620 

aggatacaaa 
9660 

aacaaccgca 
9740 

gtaaaatgaa 
9800 

ccacaaggaa 
9860 



aatgtgtaac 
9390 

aagagcgaga 
9450 

Lgggcagaat 
9510 

ccttccaaga 
9570 

aggcaggccc 
9630 

ccacaacctg 
9690 

tacctggatg 
9750 



tggcaaaagg 
9400 

cgcgacagag 
9460 

cccttcccaa 
9520 

gacaggggtt 
9580 

ccagacatgg 
9640 

gctcatacat 
9700 

cagtgtcata 
9760 



caattagatc 
9810 

acgacagccg 
9870 



aactgcagtg 
9920 



99Cgcagata 
9970 

tatgactaca 
10030 

ggtttactaa 
10090 

cgcagccaag 
10150 

aagctccatt 
10210 

ctgaaaaaat 
10270 

aacaaagaga 
10330 

c tcccaaact 
10390 

taatgtctag 
10450 

tcagcaaggg 
10510 



gcttcacaga 
9980 

tttgttaact 
10040 

tatatcacag 
10100 

aactgactca 
10160 

aggctttggc 
10220 

aagtgagtaa 
10260 

aatcatcctt 
10340 

ctt tagagaa 
10400 

caacaacttt 
10460 

cagatttcag 
10520 



acctaggtgc 
9930 

ttaccttttc 
9990 

tctcctctcc 
10050 

acccaccacc 
10110 

tatcctatac 
10170 

caacatgaga 
10230 

agcagacaga 
10290 

tacttccgca 
10350 

gccttgtatt 
10410 

taaaaaaaga 
10470 



aaaaaacgaa 
9620 

aaactcctac 
9880 

cttcaactgc 
9940 

ttacaataaa 
10000 

gaaataagac 
10060 

accccaccca 
10120 

ctgccttctt 
10180 

catccaaatc 
10240 

ttgcatacta 
10300 



gtcccgctgc 
9410 

aaagagcgag 
9470 

aatctccacc 
9530 

tggaatgcag 

9590 

caccttgctc 
9650 

catgttgacg 
9710 

acatggcccc 
9770 

gccacaagga 
9830 



tcgccacctt 
9420 

ttttatcatc 
9480 

cttcaacttg 
9540 

gagaggaaaa 
9600 

tgcatatacc 
9660 

attataacac 
9720 

t tagcaaaaa 
9780 

aatgatagcc 
9840 



gcgtatcttt 
9890 

cctgtcctta 
9950 

agaagcataa 
lOOlO 

aatgtaatcc 
10070 

actaatcatc 
10130 

aatgtactaa 
10190 

cagatacttt 
10250 

accatcccgc 
10310 



aaaatactcg 
10360 

gatatttcca 
10420 

tttgcaggtc 
10480 



ccgaagaacc 
10530 



tatgtattgc 
10570 

aactcaaccc 
10630 

ciCuLcggac 
10690 

^ccggcattt 
10750 

aragaaacag 
10S20 

ctgaacLcat 
10870 



catcttccag 
10580 

ttggtcgata 
10640 

acaaaattca 
10700 

acccagcaca 
10760 

gtccaaatcg 
10820 

tccaaacagg 
10880 



ccaccattct 
1O590 

cttgcgtLcc 
10650 

ttcaLtaccc 
10710 

gccaccatcc 
10770 

gggagrcaca 
10230 

agtcttcata 
10890 



tccacttctc 
10540 

cagggttcag 
10600 

ttctacaaca 
10660 

tctggagcag 
10720 

actcacagtg 
10780 

gccacccgct 
10340 

actrattaga 
10900 



caggcccagg 
10370 

tctgttattt 
10430 

ttagatgggc 
10490 

ctcaccttct 
10550 

agggagctta 
10610 

tccagcctcc 
10670 

cccccagaza 
10730 

gcgaacacca 
10790 

caaaaacLca 
lOBSC 

atarttaaaa 
10910 



aaaatttaca 
9900 

gactcaaciaa 
9960 

ccagagccct 
10020 

ccaggcacte 
10080 

aaacgagttc 
10140 

gaaaatcctt 
10200 

cgggaccaga 
10260 

cggcacatta 
10320 

acaaccagat 
10380 

tctggatttt 
10440 

cggagaaaac 
lOSOO 

ctggaaacaa 
10560 

aaggtctcct 
10620 

Lctrcaacac 
10680 

a=Lcaccgcc 
10740 

gzcctqzgaq 
108OO 

aaccaaaaca 
10860 

10S2O 
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atttctagga 
10930 

gaaaatcacc 
10990 

atagcacaaa 
11050 

ctcttttcaa 
11110 

catttat9ta 
11170 

ctgaaagcca 
11230 

ggaaggaqca 
11290 

ccgaagacac 

11350 

accatttagc 
11410 



atccgtcaca 
10540 

gcagtctcgt 
11000 

ataacacaca 
11060 

aatacacLgc 
11120 

aagtccagta 
11180 

atcgccatca 
11240 

ggaaccgcac 
11300 

tttcatacac 
11360 

ctagaaagca 
11420 



tggatatcct 
10950 

ttacaatcac 
11010 

gcaaaacaca 
11070 

ccaatgaaaa 

11130 

tctgcgcata 
11190 

gtagtcttct 
11250 

ttttgtttct 
11310 

gacttgtttt 
11370 

cctacaagat 
11430 



c^gcaccaaag 
10960 

gaaaacccgg 
11020 

ggagatcaac 
11060 

aagcaagcaa 
11140 

caaatgctat 
X1200 

ctgaagatta 
11260 

acatactttc 
11320 

acacgcaaga 
11360 

9cccgactgg 
1Z440 



cacaaagatg 
10970 

aaacaatcca 
11030 

gc:acata:.ac 
11090 

caaagcaaac 
11150 

ctttacacag 
11210 

gaccggggct 
11270 

gcacLgcttg 
11330 

aaacaacttc 
11390 

tgaaccctgt 
11450 



gaaaaatgaa 
11470 

ctcaatgaca 
11530 

gtttgtgcac 
11590 

9gcatacacc 
11650 

99Ctgagcgc 
11710 

ctccagtcac 
11770 

acacgagaaa 
11830 

tcataatgca 
11B90 



agatcccgcg 
11480 

ccacttggtc 
11540 

tatacaacaa 
11600 

aattagaatg 
11650 

d99Ct:gcgaa 
11720 

cattcccaaa 
11780 

gggaagaata 
11840 

tcacccagat 
11900 



aatgtcctgc 
11950 

ctgctcaaaa 
12010 

aaatgaggcc 
12070 

tcttaa tact 
12130 

tcacctccc- 
12190 

acacatctCw 
12250 

ccccgcacag 
12310 

12370 

acccttcccr 
12430 



cacttcccca 
11960 

tccttcaaag 
12020 

ctctaccatc 
12080 

ctggtagtat 
12140 

gctccaaz tc 
12200 

accaccatag 
12260 

12320 

cacgcLgaaa 
12380 

aattggcgtg 
12440 



tatgaatttt 
11490 

ctgtgtgtca 
11550 

Cattaactgt 
11610 

cactc caeca 
11670 

cttctcctta 
11730 

gttcaaaggg 
11790 

atggaatcgc 
11850 

caacgcrgag 
11910 

tctatcctca 
11970 

gcttctcatc 
12030 



agtctcaact 
11500 

tgttaccact 
11560 

gctactgcca 
11620 

gaatacacag 
11680 

ccttccctga 
11740 

agcccaaaga 
11800 

aaaagtcccc 
11860 

atccggaaag 
11920 

actctgctgc 
11980 

accctctgga 
12040 



gcaaaatatc 
11510 

ccctgtgtcc 
11570 

gagagggccg 
11630 

ttgtggataa 
11690 

aaacaacatg 

11750 



gacgaacaag 
10980 

aacacctaca 
11040 

tgacatggaa 
11100 

aatatctctc 
11160 

aaggaaatgc 
11220 

ggaaatggga 
11280 

agttttttca 
11340 

tcaaataggc 
11400 

gaagacaaga 
11460 

Cttctgcctt 
11520 

agatgaccgt 
11580 

tgaccaatga 
11640 

gccaacaaaa 
11700 

aattgtcacc 
11760 



tctcagccgc 
11810 



aggcaangca 
11870 

agaggaccat 
11930 

aagcctggcc 
11990 

taacgcccaa 
12050 



tggccctacc 
12090 

tggactggtg 
12150 

ctgccgiwcc 
12210 

ccttgggcae 
12270 

cggggaccat 
12330 

tgattcctac 
12350 

tgtgtgtatg 
12450 



ctttctcatt 
12100 

acacttccta 
12160 

cc:,ggccaca 
12220 

ctccLgctct 
12280 

cgccttcacc 
12340 

agrcaeggca 
12400 

ctaagagcac 
12460 



tttacctctt 
12110 

aacccatacc 
12170 

gataccwicc 
12230 

ttgttat:ta 
122S0 

CCtCtLICCC 

12350 

at-taa^arac 
12410 

caaaaarcta 
12470 



ttcgccctgt 
11820 

tgtaactttt 
11880 

d95tcgtgat 
11940 

atagcacgcc 
12000 

gctcaagagc 
12060 

ccwtgctccc 
12120 

ataacgatcc 
12180 

accaccccac 
12240 

:.ccttatccc 
12300 

ca-acctatc 
■2360 

ccatcacctc 
12420 

ctcrcttacc 
12490 
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aaatttctag 
12490 

ggggcaggtc 
12550 

aagctacaag 
12610 

cctccgaa tg 
12670 

ttttacactg 
12730 

aaccaaccac 
12790 

gggagaccac 
12850 

ttctgtcact 
12910 

cacttctctt 
12970 

cacaggcggg 
13030 

gagtacctcc 
13090 



tatacaa tac 
12500 

cctggcgaaa 
12560 

tcaaatccac 
12620 

atccctaccc 
12680 

ccatgcccac 
12740 

cactccccca 
12B00 

ccaacctcac 
12860 

taacaaagcc 
12920 

ggactcagga 
12980 

ctggggcacc 
13040 

tgcagcaggc 
13100 



aatgataccc 
12510 

ccccaccttc 
12570 

agactggacc 
12630 

ttcacctatt 
12690 

cgagccgcgc 
12750 

ttctgagccc 
12810 

gtggcggatc 
12870 

cttctccgcc 
12930 

caagaacaca 
12990 

cctgggccag 
13O50 

ctggggctga 
13110 



gcaagaggca 
12520 

aagccaaaga 
12580 

gagaaccccc 
12640 

tcatatatac 
12700 

ctttgtttta 
12760 

acaaaagccc 
12820 

acccccatgg 
12880 

cttctcaccc 
12940 

agaattgccg 
13000 

tcatggggtg 
13060 

gcaaggccca 
13120 



ggcaaacgcc 
12530 

cagcctaaag 
12590 

cttcccatcc 
12650 

ccacccttcc 
12710 

acctcttctg 
12770 

cggacccagc 
12830 

cccctctttg 
12890 

ttcaattgcc 
12950 

aacataggta 
13010 

agccagtgtg 
13070 

gcccggggca 
13130 



caggcagaca 
12540 

cccgaaagcc 
12600 

ggcgcacttc 
12660 

caaac tgg tt 
12720 

cgcacccaca 
12780 

cacaccgaag 
12B40 

ctgagagctg 
12900 

agtgcaaccc 
12960 

tgagccgtaa 
13020 

caaacgggca 
13080 

tcgccagcca 
13140 



gacacttcca 
13150 

gtccacatgc 
13210 

tcccttttat 
13270 

ttatgtgtat 
13330 

tctcctgcgg 
13390 

aggatctcct 
13450 

tgtgtgtgcg 
13510 



gctggcaaaa 
13160 

tgcatatcag 
13220 

ctacatctcc 
13280 

tcagcattct 
13340 

cttatttcac 
13400 

tcccccccaa 
13460 

tgtgtgt 



gtgacagaaa 
13170 

acctccagat 
13230 

tgatcccccc 
13290 

ttaagacgct 
13350 

ttagcgtaat 
13410 

ggctgaacaa 
13470 



aatcctgtat 
13180 

tcattcatct 
13240 

ctacctccgg 
13300 

gcatacaaga 
13360 

gtcctctagg 
13420 

taLCcgtgtg 
13480 



cagcaacact 
13190 

gacaaaactg 
13250 

taaccacctt 
13310 

aaga ugtgga 
13370 

accatcacgc 
13430 

cgtgtgtgtg 
13490 



actaactata 
13200 

caactctgct 
13260 

cctactctgt 
13320 

atactctttt 
13380 

tgcaaacagc 
13440 

tgcgLgtgtg 
13500 
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